关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018170人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 366 10-10

「手上有笔钱,投啥好?」

简七理财 浏览 410 09-10

开赛六轮以来,赣超累计观赛人次已突破46万

懂球帝 浏览 511 08-19

丹麦议员:我从没想过会站在美国使馆前示威

环球网资讯 浏览 271 01-19

北京多所高校被指禁用罗马仕牌充电宝 公司发声明回应

红星新闻 浏览 3582 06-15

中甲第20轮裁判名单公布,两场比赛将启用VAR

直播吧 浏览 753 08-09

欧盟公布对以色列制裁方案:暂停每年600万欧元拨款

界面新闻 浏览 437 09-18

中国超半数城市人口下滑,什么信号?

智谷趋势 浏览 4808 07-12

塔利班和美特使见面后态度转变 扭头拒绝了中方的提醒

南权先生 浏览 479 10-01

东体介绍徐嘉敏生涯:像极了与申花足协杯比赛,跌宕起伏大起大落

直播吧 浏览 6394 07-28

知名折扣店好特卖被指大量闭店 曾4年开960家

每日经济新闻 浏览 252 12-29

隆戈:米兰与德温特就150万欧年薪达协议,有望24-48小时敲定转会

直播吧 浏览 5457 08-11

在德国总理默茨面前 奔驰全新电动车出"故障"

环球时报国际 浏览 399 09-12

撞不过理想i8?乘龙卡车:法务部已在处理

三言科技 浏览 9986 07-31

透视九月车企高管换防潮:国企从上至下,民营精准补位

百姓评车 浏览 369 10-01

牛弹琴:中东发生历史性事件 两个特殊国家签特殊协议

上游新闻 浏览 463 09-18

Windows 10,即将“停服”

第一财经资讯 浏览 313 10-13

被章若楠、秦岚带火的鞋子竟然是它?春天这样穿又美又气质!

LinkFashion 浏览 211 02-28

年内最高赚超65%!这批基金“专业买家”的技术不能错过

华尔街见闻官方 浏览 285 01-06

利润预增超400%,存储芯片独角兽,势不可挡!

飞鲸投研 浏览 248 01-23

泽连斯基赠送特朗普特殊高尔夫球杆 获回赠"白宫钥匙"

环球网资讯 浏览 941 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11