关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01236人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加沙停火协议文件在埃及签署

鲁中晨报 浏览 266 10-14

苹果大连百年城店拟停业 或成为首家在华关停的直营店

界面新闻 浏览 1772 07-29

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 263 12-19

古加:今天球队展现出进攻端的新变化;我的身体状态越来越好

懂球帝 浏览 4176 08-11

贵州两所民办学校"开撕" 互指对方中高考数据造假

极目新闻 浏览 3294 07-21

极越汽车或迎新生机!

电动知家 浏览 227 11-25

村民银行卡余额-598万:无法打工 出了力"拿不到"工钱

澎湃新闻 浏览 1647 07-18

不太理想!10号秀马卢阿奇13投仅5中拿到14分5篮板 三分6中1

直播吧 浏览 8342 07-12

章子怡近照脸部发肿,最具特色的骨相优势都没了

萌神木木 浏览 255 01-20

6名员工,半年用AI实现财富自由

投中网 浏览 4299 07-17

狗仔疑似曝白百何离婚原因,陈羽凡醉酒闹事她不断善后,耗尽心力

萌神木木 浏览 2499 07-25

“1元刮刮乐”地摊走红,有电商展示“成本9元,毛利72元”,多数产品销量过万

红星资本局 浏览 8380 07-13

肾就是这样透支掉的!

科普中国 浏览 1578 10-25

飞机穿过“桦加沙”风眼捕捉到震憾画面

极目新闻 浏览 339 09-24

居民质疑7个月水费都是49.93元 自来水公司:属诬告

极目新闻 浏览 509 09-09

试飞员李国恩:首飞歼-15是我一辈子的荣耀

环球网资讯 浏览 3783 07-09

法尔克:作为升班马,对阵曼联时拿到一分始终是个不错的结果

懂球帝 浏览 262 01-05

动作片王者归来,赵文卓新片燃爆,票房断崖式领先,不输院线片

最爱酷影视 浏览 501 08-27

山东航空一航班延误近10小时 旅客质疑未安置酒店休息

极目新闻 浏览 7425 06-11

拍出了压迫感!一起感受下杨瀚森的这双超级大手!

直播吧 浏览 3693 07-17

下身基础,上身就不基础

时尚COSMO 浏览 376 09-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11