深谷多模态智能轻量六轴臂,看得懂、听得懂、做得好

发布日期:2025-11-24 浏览次数:83

        在场景智能化加速发展的当下,中科深谷基于自研的深谷智脑系统推出多模态智能轻量六轴臂,结合前沿的VLA-Pi0(视觉-语言-动作流)模型,为科研、制造、服务等行业带来高度集成、智能可控的机器人解决方案。


       多模态智能轻量六轴臂采用轻量化六自由度结构设计,具备良好的负载-自重比、便携性与开放扩展性能,可适配轮式、轮足式、四足机器人等多类移动平台,实现多场景下的移动操作任务。同时支持位置、力矩、速度等多模式控制,为科研实验与工程部署提供稳定基础。


01  产品特点


轻量化设计:重量仅3.5kg,拥有高负载自重比(最大负载1.5kg),便于搭载于轮式机器人、轮足式机器人、四足机器人、无人机等移动平台,实现跨场景移动操作。


大模型加持:借助大模型理解语言指令,自动规划动作,无需编程基础即可控制机器人,降低了使用门槛,适合新手操作。


开放可拓展:支持多种移动平台、处理器、传感器和执行器的融合应用,提供ROS/ROS2、Python、Web API等接口及C++开发套件,便于二次开发和定制。


高频精准控制:支持位置控制、力矩控制、速度控制等多种模式,具备力反馈功能,控制频率高达50Hz。


一体化功能:配备一键场景扫描功能,配合高保真仿真器,打通物理世界到数字世界的循环,加速算法训练和部署。


02  VLA-Pi0:实现语言到动作的精准映射


什么是VLA-Pi0?

       VLA-Pi0是一种视觉-语言-动作一体化模型,用于推动具身智能机器人在真实场景中的自主操作能力。它基于预训练视觉语言模型进行多模态融合,将图像、自然语言指令以及机器人自身状态综合编码,从而具备对任务语义与环境的统一理解。在此基础上,Pi0引入了基于条件流匹配的动作生成模块,可直接建模连续控制信号,并以动作序列方式输出,使机器人在执行过程中具备更高的稳定性与动作连贯性。


      训练过程中,Pi0融合不同类型机器人平台的大规模示范数据,实现跨形态泛化,使单一模型可以适配多种机械臂与移动操作设备。


       在该机械臂系统中,VLA-Pi0视觉-语言-动作流模型融合了预训练视觉语言模型(VLM)与流匹配动作生成机制,实现了从自然语言指令到连续机械臂动作的高频、高精度转化。




► 多模态统一编码:支持RGB图像、语言指令与关节状态协同输入,实现上下文感知;

► 双专家协同推理:VLM专家负责语义理解,动作专家专注机械臂状态与动作生成;

► 流匹配去噪机制:通过加噪-去噪训练策略,输出50Hz高频连续动作序列,满足机械臂抓取等任务需求。


03  平台化解决方案,赋能多元场景

       基于其高度的通用性与开放性,该六轴臂可作为标准化的智能操作单元,无缝集成至多种作业平台,形成针对不同场景的完整解决方案。


1> 科研创新平台

       可作为双臂协作、移动操作等前沿研究的理想实验载体,兼容ALOHA等主流具身智能开源框架,助力模仿学习、强化学习等算法的快速验证与复现。


2> 柔性制造工作站

       在实验室或轻量化工业场景中,可快速部署用于物料分拣、精密装配等任务,适应小批量、多品种的生产模式。


3> 智能服务移动平台

        搭载于移动底盘后,可应用于家庭服务、科技养老、物流递送等服务场景,完成取物等需要与环境交互的操作任务。



       中科深谷自主创新研发“开源智脑系统”,该系统作为开放、协同、分布式的智能中枢,业务系统实现了算力、智能机器人等资源管理,可将算力等资源灵活分配给不同用户,用户可实时控制具身智能机器人,进行高精度仿真验证,实现从虚拟调试到实体作业的无缝衔接。系统支持多形态机器人集成与智能体协同作业,覆盖先进制造、科技养老、科学研究等多元场景。可视化交互窗口还可实时展示机器人运行状态与作业流程。


       深谷智脑系统正以其强大的大小脑协同能力,为机器人注入“智力”,服务千行百业智能化升级。欢迎交流合作,共同探索具身智能技术在更多场景中的创新应用。