关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019150人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新前锋定了⌛记者:米兰正在敲定博尼法斯,交易已在走流程

直播吧 浏览 548 08-21

张升民任国家中央军事委员会副主席

新华社客户端 浏览 312 10-29

男子认亲1年后被警方告知"亲哥找到了":那家里的是谁

极目新闻 浏览 527 09-19

春秋航空会为了卖毛毯把空调温度调低吗?

快刀财经 浏览 389 09-02

Amazon和UCLA团队突破传统界限,开启无监督智能训练新纪元

科技行者 浏览 274 01-05

欧锦赛:东契奇26+10+11终获首胜 斯洛文尼亚大胜比利时

醉卧浮生 浏览 485 09-01

3.5米长眼镜王蛇闯入村民家中 吓得老两口一夜未眠

红星新闻 浏览 424 09-15

黑吃黑!骗走全球36亿的“币圈割王”,被精准猎杀

大猫财经Pro 浏览 233 11-12

记者:一旦确定无法签下伊萨克,利物浦将迅速推进埃基蒂克的转会

直播吧 浏览 2626 07-17

谁是中国第一吐槽役?

仙女事件簿 浏览 340 10-14

特朗普透露夜袭细节:"堡垒"中抓走马杜罗

新华社 浏览 204 01-04

被问前夫再婚怎么办?蔡琳一句“不影响孩子就ok”,格局真大!

娱乐白名单 浏览 10638 07-20

动力更新 领克Z20新版型售10.99万起

网易汽车 浏览 10512 07-23

杀疯了!续航630km,还配华为乾崑高速领航

隔壁说车老王 浏览 170 12-14

游刃有余!施罗德15中8贡献19分5助 正负值+29

直播吧 浏览 354 09-02

生产全靠外包,这家轮胎企业要来IPO了……

IPO日报 浏览 6903 07-25

Caviar再出手:三星Galaxy Z Fold/Flip7 24K金特别版问世

IT之家 浏览 10402 07-13

美国务卿称以军暂停加沙攻势被当场“打脸”

环球网资讯 浏览 306 10-06

工行市值逼近3万亿,五年内A股会诞生万亿美元市值的公司吗?

郭施亮 浏览 1287 07-14

英伟达推出机器人最强"大脑" ,宇树科技用上了

网易科技报道 浏览 509 08-26

春天穿衣真的很简单!衬衫配裙子、塑造留白,显瘦提气质

静儿时尚达人 浏览 122 04-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11