关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02328人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国中产的坑,美国二十年前已经踩过一遍了

虎嗅APP 浏览 2670 07-11

小米杠上奇瑞,争夺高强度钢第一!理想高管吐槽“都是键盘值”

明镜pro 浏览 265 01-23

郭磊:出口增速为何延续韧性

首席经济学家论坛 浏览 6006 07-28

《王牌对王牌》:玩不到一起真尴尬

洲洲影视娱评 浏览 211 11-09

A股年内上会数量将破百

北京商报 浏览 270 12-16

再创新高!奇瑞全新发动机成功点火,插混、增程油耗要降到1L多?

小李车评李建红 浏览 395 09-15

20万元级别的比亚迪夏,是家用MPV的新选择么?

TheCars车的名义 浏览 484 06-16

受台风影响 三亚机场9月28日9时起暂停航班起降

环球网资讯 浏览 321 09-28

冠军魔咒再应验,高芙总决赛屡屡被报一箭之仇,黯然出局

网球之家 浏览 284 11-09

春秋航空会为了卖毛毯把空调温度调低吗?

快刀财经 浏览 389 09-02

美媒:无人机竞赛美不光落后中国 甚至还比不上乌克兰

澎湃新闻 浏览 427 09-17

韩红深夜发文炸锅,四件大事信息量太大!

观察鉴娱 浏览 4832 07-14

大爆发!京东出手!

中国基金报 浏览 9564 07-25

乘机人姓名误填拼音致国际航班机票作废 平台回应

澎湃新闻 浏览 407 09-06

成都事故后,雷军最新发声

都市快报橙柿互动 浏览 387 10-17

杭州湾库里南来了 极氪9X成都车展预售47.99万起

网易汽车 浏览 459 08-29

S妈发文求救自费找人陪伴,汪小菲一家幸福满溢,没了大S全都变了

扒虾侃娱 浏览 2990 07-12

5900万黄金被劫香港警方“神速”破案 情节堪比TVB剧本

21世纪经济报道 浏览 432 09-20

三星One UI 8.5前瞻:基于安卓16,引入情景感知AI

IT之家 浏览 273 11-27

谁是真汇源?

经济观察报 浏览 322 01-21

“调改”难挽颓势,永辉超市减持红旗连锁套现8100万,去年已清仓式减持中百集团

红星资本局 浏览 304 10-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11