关闭广告

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者2025-11-11 00:00:01311人阅读


你有没有试过这样的体验:跟朋友聊天时,你想让他看看照片里的某个东西,但又不知道怎么准确描述它的位置?你可能会说"就是那个红色的杯子",朋友却问"哪个红色杯子?"这种沟通障碍在人工智能领域同样存在,而且更加复杂。

由南洋理工大学、腾讯微信视觉团队、新加坡科技研究局等多家知名机构组成的国际研究团队,最近在这个问题上取得了重要突破。他们的研究成果发表在了计算机视觉领域的顶级学术平台上,论文题目是"PATCH-AS-DECODABLE-TOKEN: TOWARDS UNIFIED MULTI-MODAL VISION TASKS IN MLLMS"(arXiv:2510.01954v1),感兴趣的读者可以通过这个编号查阅完整论文。

这项研究解决的核心问题可以用一个简单场景来理解:当你问AI"这张照片里有什么?"时,传统AI只能告诉你"有一只猫、一个杯子、一张桌子",但它无法像人一样直接"指出"这些东西的具体位置。更糟糕的是,当你要求AI找到"桌子上那个蓝色杯子"时,它往往会给出一串看起来很专业但实际上并不准确的数字坐标,比如"[245, 156, 378, 298]",普通人根本无法理解这些数字代表什么。

<
上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全新一代丰田Hilux将于11月10日正式发布

车质网 浏览 214 11-07

"6名学生遇难"事发时5块格栅板坠落 参观通道仅1米宽

每日经济新闻 浏览 5110 07-26

卢拉称和特朗普见面像"一见钟情" 上个月刚大骂特朗普

极目新闻 浏览 125 05-09

解码2025年SUV销量王,藏在爆款里的家庭用车消费新逻辑

百姓评车 浏览 293 01-08

马斯克的AI,把日本网友骂破防了,背后是日本跪美国的深层原因

北向财经 浏览 1412 07-26

甜馨点赞贾乃亮不是好丈夫评论?

大笑江湖史 浏览 8924 07-22

普京铡刀落下!库尔斯克溃败幕后巨鳄离奇自杀

浏览 2906 07-14

记者:米兰与斯特拉斯堡重启关于盖拉-杜埃的谈判,报价2000万欧

直播吧 浏览 5531 07-25

新消费周报 | 美团滴滴加速外卖平台海外布局;小红书上线本地生活会员服务;灭菌乳新国标落地实施

第一财经商业数据中心 浏览 363 09-21

CJ连续10年场均得分20+但从未进过全明星!利拉德为老队友鸣不平

直播吧 浏览 1293 07-25

小区保安与居委会副主任争执被打耳光 副主任被拘5日

红星新闻 浏览 511 09-09

日本渣男骗前女友拍全裸写真出轨

孤独的独角兽影视 浏览 285 01-16

广汽“星源增程”正式发布,昊铂HL增程版26.98万起上市交付

新周刊 浏览 493 08-21

小米汽车:辅助驾驶还不是自动驾驶,请大家正确理解使用相关功能

IT之家 浏览 6145 07-30

拔出萝卜带出泥!49岁赵薇近况被曝,原来圈内封杀只是冰山一角

凡知 浏览 8511 07-23

外媒:美国大豆收获季临近 中国一粒都没计划买

环球时报国际 浏览 593 08-18

起底西贝供应商:同款冷冻西兰花和海鲈鱼还卖给了谁

界面新闻 浏览 493 09-19

首个有期徒刑正式宣判,恒大、中植“关键人”一个都跑不了!

深蓝财经 浏览 277 11-12

E句话|在理发店,充430万做灌肠?

仙女事件簿 浏览 5331 07-10

欧洲外交官警告俄方:北约准备好击落侵犯领空俄飞机

环球网资讯 浏览 476 09-26

李开复,在成都投了一家“0卡糖”

投中网 浏览 351 10-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11