关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01342人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

跨境网赌大佬佘智江将被引渡回中国 被指曾参与KK投资

红星新闻 浏览 301 11-12

重要信号,楼市将变!

博闻财经 浏览 249 12-12

吴彦祖西湖边穿古装送花,获女游客热情拥抱

往史过眼云烟 浏览 194 03-11

特斯拉Q2财报会实录:关税带来3亿美元成本 但Robotaxi和人形机器人潜力巨大

财联社 浏览 5015 07-24

大迫敬介:巴西的球员个人能力出色,高位逼抢可能会效果不佳

懂球帝 浏览 373 10-13

今年夏天流行的“多巴胺裙子”太美了,时髦又减龄!

LinkFashion 浏览 4083 07-25

至高省3万,奔驰品牌车型立享腾势全系车型置换补贴

网易汽车 浏览 539 08-16

幸亏,吴倩离婚了

阿废冷眼观察所 浏览 6524 07-12

前英超裁判:桑德兰绝杀切尔西的进球因越位应被取消

懂球帝 浏览 329 10-27

美媒称超500名台军士兵参加美军演习 国台办回应

界面新闻 浏览 371 08-28

上海一小区新交付就出现大规模违建 公职家庭带头拆除

上观新闻 浏览 5081 06-11

售37.99万起 岚图泰山上市首月完成5000台交付

网易汽车 浏览 261 01-02

从移动设备到机器人,高通如何解锁端侧AI的「全域智能」?

雷峰网 浏览 259 01-08

老梗再爆,到底好看在哪儿?

伊周潮流 浏览 2661 06-07

台当局欲出资百亿美元参与美天然气项目 国台办回应

极目新闻 浏览 5803 06-26

太保、新华、众安上半年保费收入公布,最高同比增长23%

21金融圈 浏览 1338 07-18

欧盟外长对中俄评头论足 扎哈罗娃发文嘲讽其是"文盲"

澎湃新闻 浏览 498 09-10

李国旭:作为大连队的主帅非常幸福,在客场有这么多人支持

懂球帝 浏览 5711 07-28

Scotto:马刺将聘请雅各布-钱斯担任G联赛奥斯汀马刺的主帅

直播吧 浏览 421 08-20

扣非净利润暴跌944.18%!光学巨头欧菲光上半年再度亏损

国际金融报 浏览 476 08-20

福建舰电磁弹射技术处世界先进水平

北京日报客户端 浏览 248 11-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11