关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01443人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

最近孩子咳嗽要警惕!

网易健康 浏览 1642 11-15

为什么骑手的保障,“普惠”更重要?

财经无忌 浏览 331 10-31

夏天最好看的4件套装,高级又气质!

LinkFashion 浏览 6801 06-09

王菲近况引担忧,疑似谢霆锋再陷“老本行”

闻识 浏览 900 07-23

伊姐周日热推:电视剧《耀眼》;电视剧《校园之外第一季》......

伊周潮流 浏览 39 06-01

创造历史,黄泽林收获中国香港球员大满贯单打正赛首胜

懂球帝 浏览 485 08-26

三种动力配置 星光560将于1月15日上市

网易汽车 浏览 252 01-11

比变老更可怕的是乱穿衣,50岁女人掌握这3个技巧,好得体

静儿时尚达人 浏览 1661 07-21

3岁女童头上插刀原因披露 妈妈疑没拔出来刀才送医

极目新闻 浏览 621 08-18

茹萨:亚冠精英联赛是亚洲最好的联赛,与强队交手能提升水平

懂球帝 浏览 493 08-20

政府关门三周美公务员排长队领救济 很多人不想"露脸"

每日经济新闻 浏览 311 10-23

历史前三?阿贾-威尔逊曾表示:讨论WNBA的GOAT 我至少得是前三

直播吧 浏览 308 09-22

白宫官员:特朗普正考虑暂时退出俄乌外交斡旋

环球网资讯 浏览 556 09-01

上新|《新消费理论》:提高家庭收入是唯一出路

智本社 浏览 4981 08-14

麦当劳回应招募退休人员:该做法此前就有

澎湃新闻 浏览 19946 08-13

迈瑞联影等待复苏

猛犸资本局 浏览 426 09-01

赢下官司,击败田家,褚韶华再次证明了自己!

电和影 浏览 409 09-21

推广中奖名单-更新至2025年12月19日推广

黎贝卡的异想世界 浏览 300 01-10

更年轻化 新款丰田卡罗拉将于12月21日上市

车质网 浏览 255 12-16

【观察】图多尔下课了,但尤文的混乱何时结束?

体坛周报 浏览 361 10-28

普京和泽连斯基是否可能在北京会晤 中方回应

环球网资讯 浏览 526 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11