关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02384人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美媒:美军紧急出动F-16战机飞越叙中部城市上空"展示武力"

环球网资讯 浏览 187 12-14

重磅!陈天桥创立的AI公司MiroMind打造出全球顶尖预测型大模型,性能领先行业基准

钛媒体APP 浏览 426 09-22

推广中奖名单-更新至2025年7月24日推广

黎贝卡的异想世界 浏览 10182 08-07

伊姐十一热推:电影《江南:在爱开始的地方等你》;电视剧《围猎》......

伊周潮流 浏览 327 10-05

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 318 10-15

济南时报:中国男篮赢沙特为何如此艰难?明日对阵印度队不可大意

直播吧 浏览 4312 08-06

美军:不会容忍伊朗在军演中的“不安全行为”

新华社 浏览 234 02-01

印度47岁男子自称"大使" 开假大使馆近10年才被发现

极目新闻 浏览 7012 07-26

邢菲:被低估的90花收拾收拾准备升咖吧!

伊周潮流 浏览 394 08-23

时隔10年全胜出线,中国男篮收获了什么?

后厂村体工队 浏览 7405 08-10

6岁女童被酒店水池排水管吸住 经历绝望14分钟后溺亡

中国新闻周刊 浏览 5363 08-10

蔚来"疯狂"招工:办公室挤不下去食堂面试 月薪可达8千

每日经济新闻 浏览 309 10-24

特斯拉全面下架Model Y现车

电动知家 浏览 182 03-17

乘龙卡车回应对撞试验中"撞不过理想i8":被摆了一道

红星新闻 浏览 2368 07-31

记者:菲利克斯加盟利雅得胜利的转会已完成,只差官宣

懂球帝 浏览 9696 07-29

《生万物》大结局令人意外,费左氏彻底黑化,宁学祥却成功洗白!

电和影 浏览 462 08-25

新增AI试穿场,淘宝510答题免单零点已上线

财闻 浏览 92 05-06

光伏企业3季报里的秘密:反内卷之下,行业真的触底反弹了吗?

赶碳号 浏览 282 11-03

王晶戳穿了蔡少芬的尴尬处境?

清游说娱 浏览 496 08-19

德约选出心中的温网冠军,预测会和法网决赛一样火星四射

网球之家 浏览 6665 07-13

俄大幅加税中国汽车出口骤降58% 有商家暂停对俄业务

每日经济新闻 浏览 296 11-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11