关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013628人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

乌克兰称不需要中国提供安全保障,外交部回应

澎湃新闻 浏览 17611 08-23

特朗普为“金穹”寻找SpaceX替代方案,马斯克暗指违法

澎湃新闻 浏览 7675 07-24

药厂真核!扎卡近2年触球、成功传球、进攻三区传球均为德甲最多

直播吧 浏览 748 07-31

要素过多天空预测:阿森纳客负纽卡、利物浦客平、热刺负狼队

直播吧 浏览 388 09-26

玩换电,推增程,埃安到底要干什么

汽车公社 浏览 308 11-17

2000多年楚王大墓被盗 "摸金校尉"在村里租房3年寻墓

上游新闻 浏览 295 10-25

特朗普:在俄罗斯问题上取得重大进展 拭目以待

每日经济新闻 浏览 637 08-18

普京与金正恩通电话

新京报 浏览 7448 08-13

20岁341天,奥多贝尔成为热刺队史欧冠第三年轻进球球员

懂球帝 浏览 302 11-05

夫妻工地干活时女儿从13楼坠亡索赔89万 法院判了

极目新闻 浏览 1953 08-09

莫拉青年队教练:为皇马踢球,是这位16岁天才球员的一个梦想

懂球帝 浏览 4580 07-14

西足协公布西甲裁判名单:此前泪洒新闻发布会的主裁判将执法巴萨

直播吧 浏览 385 09-21

美媒:美方提出的28点新计划已缩减为19点

极目新闻 浏览 380 11-25

马来西亚和越南就泰柬边境局势表态 呼吁避免冲突扩大

环球网资讯 浏览 2767 07-25

欧盟关税政策考验临近,中欧关系面临转折点

浏览 9990 07-14

美军宣布再次打击"贩毒船" 致4人死亡

环球网资讯 浏览 301 10-31

68岁独居老人为"干儿子"贷款85万 家中还堆满了保健品

红星新闻 浏览 9610 07-10

比亚迪“松绑”方程豹

汽车公社 浏览 352 09-11

白宫与国会唱反调?

国际金融报 浏览 7247 07-29

全球首次!万元相机置换OPPO Find X9 Pro:OPPO最高补贴1400元

快科技 浏览 333 10-17

牛弹琴:战机又被照射后日本急了 有人第一个想到中国

现代快报 浏览 255 12-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11