关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01249人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

欲破SpaceX垄断 "火神"火箭迎历史性发射

环球网资讯 浏览 19652 08-13

继弯刀裤,阔腿裤之后,“围裹式长裤”突然大火!

LinkFashion 浏览 133 04-20

冲劲十足!13号秀奎因半场8中4砍全队最高11分外加5板 也有5失误

直播吧 浏览 1743 07-16

止步“五连涨”!美股12月“开门黑”

中新经纬 浏览 273 12-02

委内瑞拉谴责美军扣押委油轮:国际海盗行为

环球网资讯 浏览 250 12-12

女人过了60岁打扮要得体!看这些穿搭就有灵感,简约不老气

静儿时尚达人 浏览 346 10-21

中韩元首通话释放重要信号 韩媒:通话时间比美日更长

环球网资讯 浏览 8859 06-11

4月10日将举办技术发布会 蔚来ES9将在二季度上市

网易汽车 浏览 260 01-20

AI编程终于“开箱即用”了?Qwen3-Coder或许是那个质变节点

硅星人 浏览 10638 07-24

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技 浏览 443 09-02

纸糊的2500亿巨头,老板去了日本

大猫研究所Pro 浏览 553 08-12

蔡卓妍林俊贤结婚,3枚婚戒超65万,男主搬入女方豪宅同居生活

素素娱乐 浏览 119 04-29

22岁重症女孩曾1天打3份工赚70万医药费:我要活下去

封面新闻 浏览 538 08-25

近4000人离职!NASA减员目标仍未达成

网易科技报道 浏览 2464 07-28

兰博基尼Athon概念车:破产边缘的设计奇迹

老爷车 浏览 356 10-13

更运动 阿尔法·罗密欧Junior运动特别版发布

车质网 浏览 267 11-04

俄外长在朝鲜同金正恩"长时间密谈" 还回答11个问题 

新华社 浏览 4260 07-14

吴彦祖西湖边穿古装送花,获女游客热情拥抱

往史过眼云烟 浏览 194 03-11

中国商飞:柬埔寨拟采购20架C909客机

每日经济新闻 浏览 409 09-11

AI领域为何成全球反垄断执法的新战场?监管利剑指向何方?

南方都市报 浏览 7088 07-25

14岁中国女生在澳被另一中国女生刺死 两人寄宿在一家

大风新闻 浏览 8937 08-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11