参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

为异种器官移...

美前议员发文...

他怎么在内娱...

遭枪杀工人女...

超长续航+高...

抖音处置恶意...

陈红与前夫恩怨太狗血！男方曾出轨知名女主持，怒闯闺房埋下祸根

32岁英国女子跳伞坠亡系自杀事发前与26岁男友分手

从冰箱彩电大沙发到“1室1厅1厨” 场景化创新驱动中国汽车细分市场竞争升级

多晶硅期货已经暴涨80%，光伏企业为什么都没参与？

9系合围高端极氪9X闯入40-50万价格带?

高速公路离家不足30米村民被噪音折磨十余年获赔3万

暴瘦脱相后依旧无美感，蒋欣吃了骨架大的亏

高端海鲜“老炮儿”，开始扎堆做小火锅

赵露思罢工让公司颗粒无收，喂饱半个中国土特产

这才是打开秋季的穿衣方式！衣服不贪多、搭配得体，养眼舒适

事关跨境资金统筹使用新规正在征求意见

俄罗斯商品馆现关店潮加盟商：一天营业额不到2000元

阿莫林：姆伯莫下一场也无法上场，争取赶上最后一场踢埃弗顿

50+女人别穿大妈装！看看这3个“减龄穿搭公式”，显嫩还从容

最高优惠5.3万比亚迪22款车型限时促销

珍酒李渡亮3招缓压，吴向东能否坐稳“贵州首富”？

关键时刻委少将为美军＂敞开大门＂美压制委军手段披露

豆神教育过亿诉讼未及时披露被罚，董事长年薪“不够交罚款”

两部门征求意见：辅助驾驶不能当自动驾驶！未经备案OTA不得升级

“苹果牌AI”拥抱 GPT-5，预计下月登陆 iOS / iPadOS / macOS 26

DeepSeek模型版本已升级至 V3.1

为内卷止损，为长钱布局！2026两会为金融发展划重点

E句话 | 麦琳边哭边直播，又怎么啦？

真正的汽车空气动力学，应该是什么样子？