关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2025-10-22 00:00:02305人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

打开战略空间 中芯国际市值万亿新逻辑

21世纪经济报道 浏览 414 09-20

国内独家,AI、机器人双龙头,放手一搏!

飞鲸投研 浏览 3842 07-31

知情人士:乌克兰要俄全额赔偿战时损失

红星新闻 浏览 529 08-20

马斯克称特斯拉正训练新FSD模型:约十倍参数,最快下月底发布

IT之家 浏览 2235 08-07

谢广坤教诲女儿要自立:考证我同意 车你要自己买

小杨侃事 浏览 478 08-25

金工守艺人陈英泽:一锤定音,锻出山川意向

时尚COSMO 浏览 277 01-15

英伟达开盘涨出大半个AMD!黄仁勋将首次用中文演讲

第一财经资讯 浏览 2362 07-16

日赚2.5亿元的贵州茅台,放缓了增长脚步

国际金融报 浏览 1464 08-14

居然智家官宣董事长汪林朋逝世,七千员工、百亿负债谁来接盘?

野马财经 浏览 9754 07-29

远洋渔船船长在公海被杀害 家属收到凶手无精神病认定

大风新闻 浏览 510 09-08

省内首条!青岛机场开通青岛至韩国清州直飞航线

闪电新闻 浏览 7986 05-28

西芒杜铁矿石准备装船,榨取中国钢企利益的时代该结束了

北向财经 浏览 275 11-08

乌迪内斯3-2莱切,布克萨、凯南-戴维斯建功

懂球帝 浏览 337 10-26

曾负债超200亿元 知名车企宣布:马上复产

每日经济新闻 浏览 549 09-07

爱泼斯坦案再掀"阴谋论" 死亡当晚监控被指缺失1分钟

红星新闻 浏览 6575 07-10

进球大战!意大利5-4逆转以色列升至第二 基恩双响雷特吉3助攻

直播吧 浏览 447 09-09

哥大新方法:频率指纹揭示AI数学思维盲点

科技行者 浏览 331 10-22

手机eSIM开放前兆!vivo WATCH 5全面恢复移动/联通eSIM

快科技 浏览 3499 07-31

太难!董路8年为足球小将砸1800万:不与球员签约 但现在有点后悔

风过乡 浏览 331 10-18

主打家用泛越野 哈弗大狗PLUS售13.58万起

网易汽车 浏览 420 09-16

律师发现高速路收费延期 申请公开缘由被回复"涉密"

大风新闻 浏览 3610 07-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11