关闭广告

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者2026-01-05 00:00:01256人阅读


当我们人类想学一项新技能时,最常见的方法就是看别人怎么做——看视频教程、观察师傅操作,然后模仿着练习。斯坦福大学的研究团队在2024年12月发表的一项研究中,成功地让机器人也掌握了这种"看视频学本领"的能力。这项名为"Dream2Flow"的研究由斯坦福大学的Karthik Dharmarajan、Wenlong Huang、Jiajun Wu、Li Fei-Fei和Ruohan Zhang等学者联合完成,论文编号为arXiv:2512.24766v1。

这个研究解决了一个令人头疼的问题:如何让机器人理解并执行那些看似简单的日常任务。比如说,当你告诉机器人"把面包放进碗里"时,它需要理解什么是面包、什么是碗,更重要的是要知道怎样抓取、移动和放置这些物品。传统的方法需要程序员为每个动作写出详细的指令,就像给机器人编写一本超级详细的操作手册。但现实世界太复杂了,物品的形状、位置、重量都千变万化,写不完的手册根本无法涵盖所有情况。

研究团队想到了一个巧妙的办法:既然现在的AI视频生成技术已经能够根据文字描述生成非常逼真的视频,那何不让机器人先"看"一段展示如何完成任务的视频,然后从中学习物体应该如何移动?这就好比你

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

明星夫妻能消停点不?为圈钱上800个综艺,那点破事全国都看腻了

娱乐圈笔娱君 浏览 440 09-11

胜绿军!恩比德打出正名一战 全场33分末节连续内线强打

仰卧撑FTUer 浏览 100 04-29

4人违规攀爬苍山被立案:2人迷路求救耗费大量公共资源

澎湃新闻 浏览 459 09-02

冲刺双重上市,潮宏基还有多少隐忧待解

铑财 浏览 353 10-13

这届年轻人,为什么在B站写起“百字长评”?

海克财经 浏览 245 01-19

泸州老窖,迎来十年拐点,可惜是向下拐

穿透公司 浏览 494 09-02

查尔莫斯历史前五控卫:魔术师、保罗、斯托克顿、基德、欧文

直播吧 浏览 390 09-21

今年春天最流行的4组配色,过年穿时髦又高级!

LinkFashion 浏览 217 02-16

微软上线 Copilot 3D,零基础用户也能建模 3D

IT之家 浏览 7555 08-09

长安马自达正在寻找新能源时代连接用户的新方式

澎湃新闻 浏览 280 11-03

星际之门计划捧红了这家公司,化废弃能源为AI算力,估值达百亿

DeepTech深科技 浏览 291 10-25

罗志恒:三季度经济增速为何放缓?四季度经济前景如何?

首席经济学家论坛 浏览 317 10-22

徒步甘孜失温女生不排除植物人风险:刚刚从卫校毕业

鲁中晨报 浏览 352 10-11

供应链首个自主AI Agent平台发布,迈入全链路自主决策阶段

澎湃新闻 浏览 3347 07-28

居家上网课 牢记12个护眼数字

网易健康 浏览 2684 02-26

浩瀚-S超级电混架构将于7月9日亮相 极氪9X首搭

网易汽车 浏览 7183 07-09

NASA面临史上最大规模预算削减:约3870名员工离职,占比近20%

IT之家 浏览 8008 07-26

宋慧乔怎么不会老啊?

时尚COSMO 浏览 250 11-25

特朗普会见韩国代表第一句问"金正恩好吗" 韩方傻眼

澎湃新闻 浏览 4869 08-08

《飞驰人生3》,那个装逼对抗资本的少年,终成背后的资本

诗与星空 浏览 217 02-24

"侃爷"杭州演唱会取消 主办方:属实 其他的不方便说

极目新闻 浏览 5573 07-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11