关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025412人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

20万内唯一中大型插混MPV 星海V9登陆慕尼黑车展

网易汽车 浏览 444 09-10

专家:福建舰已基本就位 入列指日可待

界面新闻 浏览 366 09-24

上海确认:浦东全域开放自动驾驶!8家公司最新获批,真无人网约车来了

用车指南 浏览 1158 07-30

伊姐周日热推:电视剧《我的山与海》;电视剧《在你灿烂的季节》......

伊周潮流 浏览 184 03-16

空客天津第二条总装线投产,称产能提高需联合各方构建更具韧性的供应链

澎湃新闻 浏览 327 10-23

俄乌激战红军城 乌方称挫败俄军35次进攻

鲁中晨报 浏览 6709 08-13

郑永刚:八天四赛强度确实太大,但大家都坚持了下来拼到最后

懂球帝 浏览 277 01-23

新综艺《姐姐当家》:倪萍大姐气质足,董璇站C位

喵喵娱乐团 浏览 2234 07-18

新增城市领航驾驶辅助,领克Z10迎来LYNK Flyme Auto X 1.5.0更新

IT之家 浏览 8513 08-07

在特斯拉model Y和小米 YU7里二选一,怎么选?

蜗牛车志V 浏览 266 01-20

外卖之后,大厂鏖战硬折扣

伯虎财经 浏览 7000 08-12

姜文:“我女儿世界第一美”

陈意小可爱 浏览 380 09-19

300万粉丝的"炒粉姐"摆摊 路人:本人比视频里好看

极目新闻 浏览 7251 07-10

美媒称马杜罗请求普京提供导弹等援助 佩斯科夫回应

环球时报国际 浏览 364 11-03

媒体:俄美元首会面后 一个关于中国的可笑阴谋论出现

环球时报 浏览 574 08-19

美俄航天局高层将会晤 聚焦国际空间站与联合任务

界面新闻 浏览 8354 07-30

官方:31岁巴西中场杜黄轩获得越南国籍,1月可为越南队出战

懂球帝 浏览 304 10-17

“敢投绝杀球的怎么能叫失败者” !胡明轩距离封神就差了一点点

直播吧 浏览 493 08-19

上了年纪的女人,请远离“假时髦、精致土”,这样穿才显得体

静儿时尚达人 浏览 1739 08-05

多个品牌双11集体上调金价 每克已破1300元

潇湘晨报 浏览 290 11-12

宗馥莉陷资产纠纷被起诉 三名原告自称是同父异母弟妹

环球时报 浏览 9617 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11