关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02443人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

多晶硅期货已经暴涨80%,光伏企业为什么都没参与?

赶碳号 浏览 5248 08-14

9系合围高端 极氪9X闯入40-50万价格带?

网易汽车 浏览 8536 07-12

高速公路离家不足30米 村民被噪音折磨十余年获赔3万

大风新闻 浏览 273 01-08

暴瘦脱相后依旧无美感,蒋欣吃了骨架大的亏

陈意小可爱 浏览 519 08-11

高端海鲜“老炮儿”,开始扎堆做小火锅

餐饮老板内参 浏览 264 01-02

赵露思罢工让公司颗粒无收,喂饱半个中国土特产

成成鉴话 浏览 1722 08-13

这才是打开秋季的穿衣方式!衣服不贪多、搭配得体,养眼舒适

静儿时尚达人 浏览 360 09-25

​事关跨境资金统筹使用 新规正在征求意见

中国商报 浏览 9851 07-30

俄罗斯商品馆现关店潮 加盟商:一天营业额不到2000元

红星新闻 浏览 8850 07-25

阿莫林:姆伯莫下一场也无法上场,争取赶上最后一场踢埃弗顿

懂球帝 浏览 878 07-28

50+女人别穿大妈装!看看这3个“减龄穿搭公式”,显嫩还从容

静儿时尚达人 浏览 245 01-29

最高优惠5.3万 比亚迪22款车型限时促销

网易汽车 浏览 529 05-26

珍酒李渡亮3招缓压,吴向东能否坐稳“贵州首富”?

密探财经 浏览 432 09-11

关键时刻委少将为美军"敞开大门" 美压制委军手段披露

澎湃新闻 浏览 277 01-19

豆神教育过亿诉讼未及时披露被罚,董事长年薪“不够交罚款”

国际金融报 浏览 4492 07-16

两部门征求意见:辅助驾驶不能当自动驾驶!未经备案OTA不得升级

极目新闻 浏览 6317 08-14

“苹果牌AI”拥抱 GPT-5,预计下月登陆 iOS / iPadOS / macOS 26

IT之家 浏览 5946 08-09

DeepSeek模型版本已升级至 V3.1

网易科技报道 浏览 453 08-21

为内卷止损,为长钱布局!2026两会为金融发展划重点

独角金融 浏览 213 03-11

E句话 | 麦琳边哭边直播,又怎么啦?

仙女事件簿 浏览 428 08-12

真正的汽车空气动力学,应该是什么样子?

车瞳 浏览 500 05-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11