关闭广告

OpenAI新幻觉论文惹争议!GPT-5拉胯是测试基准有问题??

量子位2025-09-10 00:00:02448人阅读

henry 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI好不容易发了篇新论文,还是给GPT-5挽尊?

最近,《语言模型为何会产生幻觉?》这篇论文火了。

它提出模型有幻觉是因为:标准的训练和评估流程,更倾向于奖励“猜对”,而非承认不确定

正因如此,模型在面对不确定的问题时,往往会选择冒险猜测以获得更高评分。



所以,为了让模型“老实说不”,就应该重新设计评估指标,从而鼓励模型承认自己不会,惩罚随意猜测

而好巧不巧的是,OpenAI自家的GPT-5就最不爱猜测

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海楼市放大招:限购政策调整,激发市场活力

21世纪经济报道 浏览 455 08-26

中产阶层撑起了大行科工

斑马消费 浏览 5155 07-28

搭载鸿蒙座舱 新款天籁将于第四季度上市

车质网 浏览 375 09-25

梅根·凯利怒怼谷爱凌争议,揭露政客背后的偏见

动物奇奇怪怪 浏览 216 03-03

赵露思控诉资本压榨 是霸凌还是算计?

手工制作阿歼 浏览 7455 08-07

抖音处置恶意炒作账号,理想汽车:挑战法律底线的,必将承担法律后果

三言科技 浏览 4989 08-13

好离谱,全网求他当男小三

衡南县融媒体中心 浏览 416 09-20

雷军向海外转出50亿美金?小米集团回应!

浙江之声 浏览 8924 08-09

太猛了!保险巨头炒股竟大赚300多亿

财通社 浏览 295 10-20

1-0击败阿根廷,力压巴西排名南美第二!这厄瓜多尔为何这么猛?

直播吧 浏览 407 09-11

苹果华人AI大牛被挖走,为同济校友!硅谷抢人大战升级,薪酬开到10亿刀

智东西 浏览 7198 07-30

小球迷贾克斯手写信鼓励受伤的穆西亚拉,后者暖心回应

懂球帝 浏览 1323 07-14

一集封神,收视率暴涨,这剧赢麻了

独立鱼 浏览 263 11-17

300353,重大资产重组!明日复牌

中国基金报 浏览 306 11-03

2026第一部「神」剧,诞生了

独立鱼 浏览 162 01-07

费迪南德:梅努抗压能力极强;卡里克的工作重点应是保持势头

懂球帝 浏览 266 02-04

赖清德被迫取消窜访斯威士兰 更多细节披露

澎湃新闻 浏览 148 04-22

前英超前锋迪尼:可以理解伊萨克,但他没有采取聪明的办法

懂球帝 浏览 474 08-23

从“现金补贴”到“学费减负”,养娃能省多少钱?

野马财经 浏览 7163 08-07

消息称SK海力士与英伟达达成HBM4供应协议,价格较上代上涨50%

IT之家 浏览 314 11-06

小鹏 P7+ 汽车累计交付 8 万台

IT之家 浏览 349 10-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11