
DoNews1月21日音讯,The Information 月初爆料称,DeepSeek 将在本年 2 月中旬农历新年时代推出新一代旗舰 AI 模子 ——DeepSeek V4,将具备更强的写代码才能。
1 月 20 日,正巧 DeepSeek-R1 发布一周年之际,有建树者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,横跨 114 个文献中有 28 处齐提到了未知的“MODEL1”大模子标识符。
该标识符与已知的现存模子“V32”(即 DeepSeek-V3.2)被并排或区别说起。把柄代码落魄文分析,幸运彩app官方下载“MODEL1”很可能代表一个不同于现存架构的新模子。
{jz:field.toptypename/}建树者分析以为,“MODEL1”与“V32”在弊端时代上存在区别,主要体当今键值(KV)缓存的布局、稀薄性料理方式以及对 FP8 数据款式的解码赈济等方面。这些各异标明新架构可能在内存优化和计较效能上进行了针对性野心。
此前,DeepSeek 商议团队前几天还不绝发布了两篇时代论文,差异先容了名为“优化残差贯穿(mHC)”的新历练枢纽,以及一种受生物学启发的“AI 记念模块(Engram)”。时代社区臆测,正在建树中的新模子有可能会整合这些最新的商议恶果。

备案号: