DeepSeek新模型曝)光：MODEL1代码预示新架构，最快有望2月发布,modelmaker

更新时间：2026-01-21 14:13 来源：牛马见闻

房企再现大面积亏损,房企开始崩盘

中国大学数理专业的教材，对学生的要求很高,大学数理类专业是学什么?

牢A直播讲糖霜苹果，三妹和沈逸感觉听了绷不住了。饭点别看！！,糖霜苹果怎么做

3-0！U23国足再创历史强势闯入亚洲杯决赛

“含新量”不断提升工信部发布一批新兴产业发展成果

�DeepSeek 将在今年 2 月中旬农历新年期�发现 DeepSeek 在 GitHub 中更新了一�即 DeepSeek-V3.

IT之家 1 月 21 日(消息，The Information 月初爆料称，DeepSeek 将在今年 2 月(中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4，将具备更强的写代码能力。 1 月 20 日，正值 DeepSeek-R1 发布一周年之际，有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码，横跨 114 个文件中有 28 处都提到了未知的“MODEL1”大模型标识符。 该标识符与已知的现有模型“V32”（即 DeepSeek-V3.2）被并列或区别提及。根据代码上下文分析，“MODEL1”很可能代表一个不同于现有架构的新模型。 开发者分析认为，“MODEL1”与“V32”在关键技术上存在区别，主要体现在键值（KV）缓存的布局、稀疏性处理方式以及对 FP8 数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。 此前，DeepSeek 研究团队还陆续发布了两篇技术论文，分别介绍了名为“优化残差连接（mHC）”的新训练方法，以及一种受生物学启发的“AI 记忆模块（Engram）”。这一举动不禁引起用户猜测，DeepSeek 正在开发中的新模型有可能会整合这些最新的研究成果。敬请期待。

编辑：约翰·斯拉特里