当前位置:首页 >>> 行业相关资讯

AI人形机器人研究:与汽车行业联动,主机厂押注人形机器人赛道

发布时间:2023-11-20 20:32:50

与机械臂、AGV相比,AI人形机器人应用场景更具通用性

 

AI人形机器人是指由AI大模型赋能,具有与人类似外观和运动方式的机器人。AI大模型从语音、视觉、决策、控制等多方面与人形机器人结合,使机器人具备理解指令并执行指令的功能。
 
借助AI大模型赋能,AI人形机器人应用场景更具通用性。
 
例如,2023年8月,智元机器人推出的远征A1,由百亿级参数的WorkGPT大模型赋能,拥有理解指令,并对指令进行任务编排和执行闭环能力。预计2024年商用,并率先用于工业制造领域如3C 制造、 汽车制造,随后逐步走向to C应用如家庭场景。
 
2022年8月,小米推出的Cyberone。其搭载自研Mi-Sense 深度视觉模组+ AI 交互算法,拥有三维空间感知能力,实现身份、手势和表情识别。此外,在情绪感知上,其能识别85 种环境语义和 6 大类 45 种人类情绪。未来将率先用于小米智能制造工厂、同时还支持多种应用场景,如家庭助理、陪伴机器人、教育辅助等。

智元机器人元征A1应用场景示例

 

AI人形机器人大模型从VLM向VLA进化

 

      RT-2一方面吸收了VLM语义推理、问题解决、视觉解释能力,另一方面能从真实的机器人动作中实现具身任务推理,且两方面能够相互促进。

 

训练方式上,RT-2通过将机器人动作拆解为文本token的形式,实现了直接与视觉语言数据混合后输入VLM进行联合微调。

 

RT-2不仅是对现有VLM模型的简单而有效的修改,还展示了构建通用物理机器人的前景,让机器人可以推理、解决问题和解释信息,以在现实中执行各种任务。