深谷多模态智能轻量六轴臂，看得懂、听得懂、做得好

发布日期：2025-11-24 浏览次数：83

在场景智能化加速发展的当下，中科深谷基于自研的深谷智脑系统推出多模态智能轻量六轴臂，结合前沿的VLA-Pi0（视觉-语言-动作流）模型，为科研、制造、服务等行业带来高度集成、智能可控的机器人解决方案。

多模态智能轻量六轴臂采用轻量化六自由度结构设计，具备良好的负载-自重比、便携性与开放扩展性能，可适配轮式、轮足式、四足机器人等多类移动平台，实现多场景下的移动操作任务。同时支持位置、力矩、速度等多模式控制，为科研实验与工程部署提供稳定基础。

01 产品特点

轻量化设计：重量仅3.5kg，拥有高负载自重比（最大负载1.5kg），便于搭载于轮式机器人、轮足式机器人、四足机器人、无人机等移动平台，实现跨场景移动操作。

大模型加持：借助大模型理解语言指令，自动规划动作，无需编程基础即可控制机器人，降低了使用门槛，适合新手操作。

开放可拓展：支持多种移动平台、处理器、传感器和执行器的融合应用，提供ROS/ROS2、Python、Web API等接口及C++开发套件，便于二次开发和定制。

高频精准控制：支持位置控制、力矩控制、速度控制等多种模式，具备力反馈功能，控制频率高达50Hz。

一体化功能：配备一键场景扫描功能，配合高保真仿真器，打通物理世界到数字世界的循环，加速算法训练和部署。

02 VLA-Pi0：实现语言到动作的精准映射

什么是VLA-Pi0？

VLA-Pi0是一种视觉-语言-动作一体化模型，用于推动具身智能机器人在真实场景中的自主操作能力。它基于预训练视觉语言模型进行多模态融合，将图像、自然语言指令以及机器人自身状态综合编码，从而具备对任务语义与环境的统一理解。在此基础上，Pi0引入了基于条件流匹配的动作生成模块，可直接建模连续控制信号，并以动作序列方式输出，使机器人在执行过程中具备更高的稳定性与动作连贯性。

训练过程中，Pi0融合不同类型机器人平台的大规模示范数据，实现跨形态泛化，使单一模型可以适配多种机械臂与移动操作设备。

在该机械臂系统中，VLA-Pi0视觉-语言-动作流模型融合了预训练视觉语言模型（VLM）与流匹配动作生成机制，实现了从自然语言指令到连续机械臂动作的高频、高精度转化。

► 多模态统一编码：支持RGB图像、语言指令与关节状态协同输入，实现上下文感知；

► 双专家协同推理：VLM专家负责语义理解，动作专家专注机械臂状态与动作生成；

► 流匹配去噪机制：通过加噪-去噪训练策略，输出50Hz高频连续动作序列，满足机械臂抓取等任务需求。

03 平台化解决方案，赋能多元场景

基于其高度的通用性与开放性，该六轴臂可作为标准化的智能操作单元，无缝集成至多种作业平台，形成针对不同场景的完整解决方案。

1> 科研创新平台

可作为双臂协作、移动操作等前沿研究的理想实验载体，兼容ALOHA等主流具身智能开源框架，助力模仿学习、强化学习等算法的快速验证与复现。

2> 柔性制造工作站

在实验室或轻量化工业场景中，可快速部署用于物料分拣、精密装配等任务，适应小批量、多品种的生产模式。

3> 智能服务移动平台

搭载于移动底盘后，可应用于家庭服务、科技养老、物流递送等服务场景，完成取物等需要与环境交互的操作任务。

中科深谷自主创新研发“开源智脑系统”，该系统作为开放、协同、分布式的智能中枢，业务系统实现了算力、智能机器人等资源管理，可将算力等资源灵活分配给不同用户，用户可实时控制具身智能机器人，进行高精度仿真验证，实现从虚拟调试到实体作业的无缝衔接。系统支持多形态机器人集成与智能体协同作业，覆盖先进制造、科技养老、科学研究等多元场景。可视化交互窗口还可实时展示机器人运行状态与作业流程。

深谷智脑系统正以其强大的大小脑协同能力，为机器人注入“智力”，服务千行百业智能化升级。欢迎交流合作，共同探索具身智能技术在更多场景中的创新应用。