关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029860人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

零跑汽车上半年销量新高,扭亏为盈,营收同比大增近180%|财报见闻

华尔街见闻官方 浏览 540 08-19

开腻了BBA的县城老钱们,爱上了理问零?

快刀财经 浏览 444 08-12

加州大学欧文分校发明"内部监控器":让大模型自己识别胡说八道

科技行者 浏览 232 02-05

纳斯达克称申请将工作日交易时长延长至23小时

财联社 浏览 273 12-16

“心理+AI”赋能智慧养老 上海创新“数字反哺”助老模式

东方网 浏览 9196 07-13

委内瑞拉武装部队宣布增招士兵5600名

界面新闻 浏览 272 12-09

杨幂刘亦菲后同桌零互动,深扒两人闹僵原因

萌神木木 浏览 279 10-25

ED网红病,正在掏空年轻女性

她刊 浏览 162 04-09

张水华开直播官宣周五出发周末战重

劲爆体坛 浏览 265 01-15

半个娱乐圈为肖战包场,《得闲谨制》票房走俏,侯鸿亮鞠躬致谢

娱乐圈笔娱君 浏览 208 12-05

好心载同事却出车祸遭索赔 法院:司机承担60%赔偿责任

极目新闻 浏览 313 10-23

英伟达拟向英国自动驾驶初创企业 Wayve 投资 5 亿美元

IT之家 浏览 409 09-20

范曾晚节不保?亲题牌匾下堆满烂鞋,还曾给释永信美女弟子题字

萌神木木 浏览 500 08-21

看了今年春晚阵容,难怪球球评论区沦陷,大家太思念本山大叔了

萌神木木 浏览 256 01-08

60+女人,秋天穿衣“上紧下宽”,不紧绷、不暴露,优雅年轻

静儿时尚达人 浏览 351 10-16

卡帕西8000行代码手搓ChatGPT,成本仅100美元,手把手教程来了

量子位 浏览 366 10-14

毛衣+衬衫、夹克+裙子,今年秋天最流行的4组搭配,时髦又减龄!

LinkFashion 浏览 264 10-16

男网红被指娶三个残障老婆 抖音回应

大风新闻 浏览 474 08-22

广州"尿毒症工厂"员工:打工几十年买房得病后坐吃山空

剥洋葱people 浏览 5455 08-13

梁靖崑0-3拉森福斯无缘16强!全场打不出节奏,第二局被逆转!

篮球资讯达人 浏览 515 08-20

问界M7改款、小鹏首款增程亮相!这批申报新车太有料了

电车通 浏览 2358 08-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11