新闻动态
你的位置: Ninegame-九游体育(中国)官方网站|jiuyou.com > 新闻动态 >
DeepSeek V3.1 一上线Ninegame九游体育,官方的一条留言就把悉数这个词 AI 圈炸了。
新的架构、下一代国产芯片,短短不到 20 个字,却信息量满满,激励热议。
这两天老狐看了不少科普文后,简便相识即是:国产 AI 正在走向软硬协同阶段,将来模子有望执行性减少对英伟达、AMD 等海外算力的依赖。
同期,此次更新还肆虐了"性能越高成本越贵"的行业魔咒,让金融、医疗等高算力场景的诈欺设想空间一下子被掀开。
成本商场的响应也很平直:DeepSeek 一官宣,国产芯片见地股应声大涨,逐日互动尾盘直线拉升,收盘大涨 13.62%。
有网友捉弄说:国产芯片迎来史诗级暴涨,DeepSeek 一句话,周五大盘平直冲上 3800 点。
这两天,DeepSeek 官方上线 V3.1 版块,没威望汹汹宣传,就像正常相似低调发个公告。
老狐整理了一下此次 V3.1 的更新,最中枢、最有创新性的创新,即是它的搀杂推理架构—— Hybrid Reasoning Architecture。
这个架构能同期援手想考花式和非想考花式,用户可以随时切换,想逐渐分析就逐渐分析,想快速出足下也没问题。
以前 DeepSeek 的居品线里,单干很明晰:V3 模子擅长通用对话,R1 模子更偏深度想考。这种分散式架构克己是,各个模子王人能在我方擅长的范围表现可以,但用户来往切换很婉曲。
目下,V3.1 肆虐了这种壁垒,把通用对话、复杂推理、专科编程等多种中枢功能集成在归拢个模子里,让使用体验更无邪,着力更高。
不仅如斯,V3.1 的推理着力也大幅提高。官方数据走漏,想考花式下,它在各项任务的平均表现和前代顶级 R1-0528 捏平,但输出的 token 数目减少了 20% 到 50%。非想考花式下,输出长度也更短,但性能不打折。
这背后其实是"想维链压缩"在起作用:模子在磨真金不怕火阶段学会生成更爽朗、高效的推理旅途,同期保证谜底准确。简便相识,即是算法更灵巧了。
为什么要这么作念?很简便:省钱!
往日,想维链固然能让模子推理更强,但冗长的中间纪律会带来端淑贪图成本和 API 调用用度,想大范畴诈欺就很难
V3.1 的想维链压缩,恰巧照看了这个问题,把高等 AI 推理能力从学术器具酿成了可大范畴交易化使用的经济有讨论。
社区测试中,DeepSeek V3.1 在 Aider 多谈话编程测试里,分数如故杰出了 Claude 4 Opus,而况成本还更低。
这下诞生者王人在刷屏了,Hugging Face 上的热度也蹭蹭往上。
值得一提的是,DeepSeek 官宣 V3.1 的时辰提到,此次模子用了 UE8M0 FP8 Scale 的参数精度,同期对分词器和 chat template 也作念了不小的调度,是以和之前的 V3 有昭着区别。
说到 DeepSeek V3.1 用的 " UE8M0 FP8 ", 老狐简便学习后科普一下:
FP8 即是把正常浮点数压缩成 8 位来存,既省空间又省算力。
再加上 MXFP8 的"块缩放"想路:把数据分块,每块用我方的缩放悉数,这么既不会丢太多信息,又能检朴更多资源。
名字里的 U、E、M 可以相识为"无秀雅 + 指数 + 余数"。UE8M0 里悉数 8 位王人用来暗意指数,莫得余数和秀雅位,这让处理器规复数据时十分心圣:独一迁移指数位就行,毋庸作念复杂乘法,速率快、旅途短。
这个时局的另一个上风是动态范围大,可以同期暗意很大和很小的数,箝制易溢出或被压成 0,也即是在保证 8 位张量精度的同期,把信息耗损降到最低。
这对国产新芯片终点合适,以前大部分国产 AI 芯片用的如故 FP16/INT8,没法原生用 FP8。
为什么说它更适合下一代国产芯片?目下大部分国产 AI 加快器如故 FP16/INT8 有讨论,莫得齐备的 FP8 单位。
新一代芯片,比如摩尔线程 MUSA 3.1 GPU、芯原 VIP9000 NPU,王人开动援手原生 FP8,DeepSeek V3.1 的 UE8M0 时局恰巧匹配这些硬件。
精致一句话:UE8M0 FP8 让模子在新一代国产芯片上跑得更省空间、更快、更稳,同期保捏精度。
这亦然为什么 DeepSeek 官微终点提到它,为国产 AI 带来了更低成本、高性能的新可能。
再来望望更新后一些体验,大家关爱的官网能不成平直考察,官方也给出了谜底。
掀开官网一看,DeepSeek 把 App 和网页端的"深度想考(R1)"改成了"深度想考",官方证据了网友之前的揣测——模子如故更新了。
望望全能的网友们,王人玩出了什么新模样。
推特 X 上有 AI 博主分析新模子生成的小球最初着力更适应物理定律了,还能调重力、摩擦、旋转速率、弹跳这些参数。
还有东说念主平直用 DeepSeek V3.1 作念了个振动编码,赶快变身 VJ。
更有网友让 V3.1 给我方画了个自画像,画风不测终点。
不外,社区中如故有部分用户吐槽翻译和写稿,SYSTEM PROMPT 需要现场写教导,中英夹杂和错词偶尔出现,有点乱。
感有趣的狐友们,目下可以上官网自行体验一番了 ~
老狐以为每次 DeepSeek 更新王人让东说念主期待下一次,险些快成了国产 AI 的精神图腾了,一说念期待 DeepSeek R2 吧。
参考尊府:
DeepSeek、智东西、X、微博等网罗
裁剪:不吃麦芽糖Ninegame九游体育
下一篇:九游体育app(中国)官方网站随后网友们启动总结规章-Ninegame-九游体育(中国)官方网站|jiuyou.com