关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2026-01-29 00:00:01252人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联通三季报:宽移用户净增规模创新高,首次披露云收入数字

南方都市报 浏览 374 10-23

一场战事 三重短缺冲击全球经济

上观新闻 浏览 134 04-20

收手吧IDM,外面全是Fabless

爱集微 浏览 6928 07-30

有种的冲这儿打!

电影最TOP 浏览 370 10-19

牛弹琴:2025年最后1个月大戏上演 印度迎最重要客人

北京日报客户端 浏览 364 12-05

高铁无缝换飞机 天津西站值机托运一站搞定

环球网资讯 浏览 5639 06-22

推荐两款顶配车型 长安启源A06购车指南

车质网 浏览 255 12-21

随着日本3-0,韩国4-2,U23亚洲杯最新形势:2支6分队未提前晋级

侃球熊弟 浏览 281 01-11

特斯拉获批德州网约车牌照 为Robotaxi运营铺平道路

财联社 浏览 5350 08-09

中国地铁,花式搞钱

花朵财经 浏览 519 08-20

李湘账号被封;蔡依林鸟巢开唱:张水华直播道歉

娱乐圈那档子事儿 浏览 278 01-19

机器人北京上学记

经济观察报 浏览 388 09-21

黄仁勋减持22.5万股英伟达股票 累计套现近3320万美元

财联社 浏览 1724 06-28

记者:在不用参与训练时,B费也会在场边观看以给予队友鼓励

懂球帝 浏览 278 10-29

特朗普:加沙"和平委员会"已成立

新京报 浏览 269 01-17

自然奇趣志|大树也“社恐”:探秘“树冠羞避”现象

半岛晨报 浏览 108 05-06

金正恩:朝鲜和韩国绝对不会合并成一个国家

界面新闻 浏览 408 09-23

黄仁勋放豪言:到2027年Blackwell和Rubin芯片至少创收1万亿美元

华尔街见闻官方 浏览 199 03-17

知名金融巨头女高管遭枪击身亡,年仅43岁

每日经济新闻 浏览 2691 07-30

造车,京东方向盘转向的下个万亿市场?

速度计 浏览 330 10-22

《阿凡达3》不及预期,3个小时全是野人乱跑,排片降了不被看好

萌神木木 浏览 162 12-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11