本文来自微信公众号“电子发烧友网”,
电子发烧友网综合报道,在节前的机器人学习大会(CoRL)上,NVIDIA发布了一系列突破性技术,包括开源物理引擎Newton、机器人基础模型Isaac GROOT N1.6以及全新AI基础设施。这些技术为机器人研发提供了一套完整解决方案,旨在缩小仿真与现实之间的差距,加速人形机器人从实验室走向实际应用的进程。
Newton:机器人“身体”的精准仿真引擎
长期以来,人形机器人复杂的关节控制、平衡调节与动作迁移难题,让现有物理引擎难以满足需求。此次NVIDIA联合Google DeepMind、Disney Research推出的开源物理引擎Newton,彻底打破这一僵局——基于NVIDIA Warp和OpenUSD框架构建、由Linux Foundation管理的它,不仅兼容多种物理求解器,更能精准仿真机器人在雪地、碎石路行走,或操控杯子、水果等精细动作,且能安全可靠地将这些技能迁移到现实场景。
苏黎世联邦理工学院机器人系统实验室、慕尼黑工业大学、北京大学等全球顶尖高校,以及光轮智能、Style3D等机器人技术公司已率先应用Newton开展研发。“全球超过25万机器人开发者亟需精准的物理仿真技术,以确保在仿真环境中教会机器人技能,同时安全可靠地迁移到现实世界。”NVIDIA Omniverse与仿真技术副总裁Rev Lebaredian表示,“Newton正是解决这一痛点的关键工具。”
Isaac GROOT N1.6:赋予机器人“深度思考”能力
机器人不仅需要精准的动作控制,更需要理解模糊指令并应对复杂场景的能力。NVIDIA Isaac GROOT N1.6开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,并借助已有知识与常识执行任务。
该模型即将在Hugging Face平台上线,届时将集成NVIDIA Cosmos Reason——一款专为物理AI打造的开源、可定制推理视觉语言模型。作为机器人的“深度思考大脑”,Cosmos Reason能够利用已有知识、常识和物理原理,将模糊的指令转化为逐步执行的计划,从而应对新场景并泛化到多种任务中。
Cosmos Reason作为机器人的“深度思考大脑”,其创新点在于:
- 物理常识知识库:内置结构化物理知识库,包含物体动力学属性(如“玻璃易碎,抓取时压力需<5N”)和动作-效果关联(如“推开沉重的门时,需先施加推力,再保持门的运动轨迹”);
- 层次化任务拆解:面对模糊指令(如“把红色盒子放到书架第二层”),模型会分三步拆解——目标解析、子任务拆分和动作参数化,将抽象指令转化为机器人关节的具体参数。
在NVIDIA内部测试中,面对100条模糊物理指令,Cosmos Reason的任务拆解准确率达91%,远超传统视觉语言模型的68%。
全新AI基础设施:支撑机器人研发全流程
为支持这些先进技术和软件库,NVIDIA推出了专为高要求工作负载设计的AI基础设施,具体包括:
- NVIDIA GB200 NVL72:集成36个Grace CPU和72个Blackwell GPU的机架式系统,目前已由各大云服务提供商采用,可显著加速AI训练和推理过程;
- NVIDIA RTX PRO服务器:为机器人开发提供统一架构,支持训练、合成数据生成、机器人学习和仿真等全环节需求;
- NVIDIA Jetson Thor:搭载Blackwell GPU,能够支持机器人同时运行多个AI工作流,实现实时智能交互。
结语
从仿真引擎到推理模型,从数据生成到硬件支撑,NVIDIA此次发布的技术矩阵,正打通机器人“研发-测试-落地”全链路。随着开源生态的持续完善与产学研协同的深化,人形机器人距离“走进日常生活”的目标,正迈出关键一步。
