关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者2026-02-04 00:00:01243人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小沈阳回应女儿专辑争议:准备第二张专辑

极目新闻 浏览 7296 07-03

奇瑞品牌大整合,成立“新四大”事业群

汽车公社 浏览 6759 07-08

NBA历史前5都有谁?

仰卧撑FTUer 浏览 9876 08-07

江苏4家银行同日被罚720万、两人禁业,南京银行收年内第4张罚单

湘财Plus 浏览 7471 07-28

快船官宣季前赛赛程:10月10日战广州男篮 18日收官PK库里勇士

醉卧浮生 浏览 7528 08-13

财政部、税务总局对《中华人民共和国增值税法实施条例》草案征求意见

网易财经 浏览 543 08-12

58岁侯勇老来得子!携小20岁三婚妻子亮相澳门

阿纂看事 浏览 270 12-16

吴世春:企业遇到发展瓶颈怎么办?很多问题要上升一个维度才能解决

创业家 浏览 403 09-11

豪华车惊爆价 一汽奥迪A5L预售25.68万起

网易汽车 浏览 970 07-21

鲁本-迪亚斯:我不在乎其他队的心理游戏,我只关心我们自己

懂球帝 浏览 385 09-21

高叶哭戏震撼全网,张艺谋15年前预言成真!

乡野小珥 浏览 8760 07-28

波士顿动力人形机器人亮相CES 拟2028年进厂造车

网易汽车 浏览 252 01-07

德国计划支持乌克兰生产远程武器 还将提供50亿欧元军援

环球网资讯 浏览 981 05-29

《阿凡达3》票房预估214亿,195分钟一刀不剪,力争影史第一

娱乐圈笔娱君 浏览 279 12-05

多名省级党委常委跨省履新 包括2名中候补

上观新闻 浏览 393 09-26

顺利康复!浓眉眼睛手术后首次进行5v5对抗训练

体坛周报 浏览 395 09-21

工信部印发通知 使用位长15位的电话号码来了

界面新闻 浏览 8436 07-04

00后吴宜泽夺冠 业内:球员赴英国训练 每年花几十万

每日经济新闻 浏览 148 05-09

iPhone17 Pro被曝将涨价5%,Air版首发无国行?

观察者网 浏览 367 09-09

意媒:莱奥和恩昆库在休息日加练,力争尽快恢复最佳状态

懂球帝 浏览 395 09-09

美抓捕非法移民引发冲突

浏览 9450 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11