让双脚机器人行走并不难,上课但让他们表演“跳舞”或“拳击”是从虚非常具有挑战性的。机器人的拟课运动方式越接近人类,它就越能自然地融入人类环境,真实而不改变人类原有的表演生活和工作空间。因此,何机研究如何使机器人的器人运动能力更接近人类是一个长期的话题。
但在机器人姿态动作变化的上课背后,不仅涉及到物理形态的从虚变化,还涉及到对控制精度、拟课平衡保持和动作连贯性的真实深入考验。
就像孩子们学会走路一样,表演站立和行走只需要掌握重心转移和平衡,何机而“转身跳舞”需要全身协调,器人涉及手臂、上课腿和核心肌肉的协调。机器人也面临着类似的挑战——行走只需要控制腿,而跳舞或拳击需要精确的协调,任何微妙的延迟或误差都会导致僵硬、不连贯甚至摔倒。
在这种全身控制方面,传统的机器人控制系统就像“遥控车”,依靠提前编写的“动作剧本”,逐帧执行预设的动作指令。这种“固定动画”控制模式在简单的任务中表现良好。
但当环境发生变化或需要持续动态行动时,问题就会暴露出来——僵硬的动作,明显的卡顿。
英伟达,12月18日,MIT、加州大学联合发布了一项最新研究,提出了Exbody2,它可以帮助机器人打破“固定脚本”带来的运动限制,并教授机器人,使机器人更具表现力Exbody2的工作方式更像是一个聪明的“舞蹈教练”,不再局限于“每一帧的动作指令”,而是教机器人理解“运动的节奏和方向”。
这样,通过这种方式,Exbody2增强了双足机器人的平衡性和适应性,使其在面对轻推、复杂地面等场景时更加稳定。
简单来说,Exbody2的控制逻辑更像是人类的运动模式——人类在跳舞时不会记住每一步的具体位置,而是依靠节奏感和动作的连贯性来完成整个舞蹈。它注重关键部位的运动节奏和方向,帮助机器人在动态环境中实时调整动作。由于这种方法,机器人具有连续流畅、相对稳定的运动能力,达到“即兴表演”的效果。
在这项研究中,研究人员使用宇树G1和H1人形机器人进行测试:

(人与G1机器人双人舞)

(G1机器人户外转换步态)

(机器人拳)
此外,ExBody2不仅可以在虚拟环境中训练机器人,还可以将这些技能转移到现实世界,帮助机器人在Sim2Real(从虚拟到现实)中顺利进入现实世界。
从虚拟课堂到真实表演:
如何“上课”机器人?
在传统的机器人动作控制方法中,让机器人模仿人类复杂的花式动作,就像让大象爬树一样,不仅不现实,而且可能会“累”。就像一个人跳舞一样,每一步都要准确地盯着脚和手的每一个动作,以免出错。一旦某一帧出现偏差,后续动作就会变得不稳定,就像“连锁反应”一样,使动作变得越来越僵硬。
Exbody2更像是让机器人学会“跟随节奏跳舞”,而不是记住每一个动作。它将控制逻辑分为关键点跟踪(控制动作的关键位置)和速度控制(调整动作节奏),两者独立运作。
与传统的“全球控制”相比,Exbody2采用了局部关键映射,就像在机器人上安装了一个“局部导航系统”一样。这样,即使某个动作有轻微的偏差,它也不会“移动全身”,机器人仍然可以顺利地完成动作。
此外,Exbody2的设计师还使用了一个新的想法:选择一些真正合适的动作,而不是挑战机器人。从大量的动作数据集中,他们将这些动作分类为“分级处理”,就像选择教科书一样。

(来源:Exbody2论文: Advanced Expressive Humanoid Whole-Body Control》,机器人关键点跟踪、关节精度和速度控制误差评估在不同数据集下;D₅₀、D₂₅₀、D₅₀₀、DCMU,从简单到复杂的动作难度,有四种不同的数据集。)
他们将数据集分为四个“动作难度包”:
● D50:入门版,就像小学一年级的课本一样,内容简单易学,包括站立、行走等基本动作;
● D250:进阶版,开始加入跑步和简单的舞蹈动作,难度适中,正好适合“稳步进步”;
● D500:高级版,它包含了更复杂的动作,如单脚跳跃和旋转,有点棘手,但也更具挑战性;
● DCMU:完整版,它包括所有的动作,从普通的步态到困难的滚动和地板动作,几乎“包罗万象”,但也带来了大量的噪音和无法完成的任务。
这种分级筛选过程,就像为一个孩子选择适龄的书一样。成年人不会指望一个刚学会读书的孩子去莎士比亚读书,机器人也是如此,学习过程需要逐步推进。如果一开始就让它面对“困难水平”,它可能会在错误的尝试中迷失方向,甚至完全放弃。
有趣的是,实验发现D250数据包性能最好。它的难度设计恰到好处,既包含了多样化的动作,又没有增加那些让机器人望而却步的“极限挑战”。相比之下:
● D50数据包虽然简单高效,但内容太基本,机器人很难处理稍微复杂的任务;
● DCMU数据包D500由于动作过于复杂,增加了无效训练的噪音,拖累了整体效果。
D250就像一本结构合理的练习本,不仅给机器人带来挑战,而且不会给机器人带来太大的压力。通过这样的筛选,Exbody2为机器人创造了一条学习的道路,使其能够稳步掌握动作技能,最终在现实世界中自信地“展示舞蹈”。
有了高质量的数据集,Exbody2的教学进入了“教师-学生”架构的核心过程,包括虚拟环境中的“教师机器人”和真实环境中的“学生机器人”。
在这个架构中,“教师机器人”它是一个领导者,生活在虚拟环境中,有丰富的“特权信息”,如关节的位置、速度和身体的物理反馈。就像一个经验丰富的舞蹈教练一样,教师机器人通过加强学习算法(PPO)不断优化自己的动作,从单脚跳到连续旋转,每一个细节都打磨到位。
而“学生机器人”学习条件不是那么优越。当它进入现实世界时,它面临着复杂而多变的环境。没有像教师这样的“特权信息”,它只能依靠历史数据和观察到的反馈。这就像一个学生只能通过观看视频来模仿舞蹈,而不能直接从教练那里得到详细的指导。
ExBody2为了弥补信息的不足,采用了一种叫做“DAgger该算法将教师的复杂指令简化为学生能够理解的观察数据。这个过程类似于将高清视频压缩成清晰的GIF动画。虽然没有细节,但核心动作是可以保留的。
真实环境的大考验:
Exbody2是否是一个真正“聪明”的机器人学习系统,最终的测试取决于它在真实环境中的表现。就像一个学生在课堂上表现良好一样,如果他在考场上表现不佳,他就不能被认为是一个优秀的学习者。因此,Exbody2不仅在“课堂”中训练机器人,而且通过一系列实际测试来验证机器人在不确定环境中的表现,以验证该系统的“智能”。
在这次考验中,研究团队设计了机器人之间的“现场竞争”。他们将机器人放置在各种动态环境中,如不均匀的地面、动态障碍物、突然的轻推等,以模拟现实世界中常见的紧急情况。面对这些“测试”

(人形机器人在现实世界中执行各种有表现力的全身动作)
最有趣的测试是“推挤测试”。在实验中,研究人员故意轻轻推动行走中的机器人,模拟儿童在家庭环境中意外撞击机器人的场景。结果表明,Exbody2的机器人反应非常敏感,可以快速调整重心,稳定地站立。相比之下,使用传统控制方法的机器人要么停滞不前,要么直接摔倒,显得“不知所措”。这种稳定性得益于系统的高效学习方法,使机器人不仅能在理想的环境中自由行动,而且能在不确定的动态环境中灵活应变。
Exbody2的机器人除了“推挤测试”外,还通过了“复杂地形行走”测试。实验室模拟了崎岖的地面环境,如小台阶和倾斜的道路。在这种环境下,普通机器人往往“不稳定”,容易滑倒。Exbody2的机器人就像一个穿防滑鞋的登山者,步伐稳定,可以调整步长和姿势,平静地跨越台阶和不规则的地面。这种表现背后的关键是,机器人可以“记住”以前的动作调整,并在遇到类似的环境时迅速做出“类似的反应”。这种记忆能力使它在不断变化的环境中“一步一步”,不像传统的机器人只会在固定的环境中反复做同样的动作。
这些测试不仅是实验室中的“花架”,而且具有一定的实际意义。例如,当家里的清洁机器人清洁地面时,地面上突然出现了一个小玩具,普通机器人可能会直接卡住或多次尝试绕道,但Exbody2的机器人可以快速“理解”前面的变化,并做出合理的绕道决定。
此外,这种“灵活反应”在工业装配线中也至关重要。传统的工业机器人只能在指定的位置“取物”,但如果装配线上突然出现偏移材料,Exbody2机器人将迅速调整位置,积极适应材料的位置变化,就像装配线上的“超级工人”一样,不再是一个“僵化的机械手”。
为验证ExBody2在不同场景中的表现,研究团队还量化了关节位置精度(下表Eₘ)等几个关键性能指标;ₚⱼₚₑ) Exbody2的机器人误差降低,普通机器人误差高出几倍,直接反映在动作的准确性上。
在其他指标中,如关键点位置误差(Eₘₚₖₚₑ)、速度误差(Eᵥₑₗ)Exbody2有优势。

(在宇树G1和H1上,ExBody2与其他方法的性能对比结果)
综上所述,Exbody2的成功不仅体现在课堂上的“标准化训练”上,也体现在真实环境中的“灵活应变”上。通过处理“推挤”、Exbody2的机器人在“复杂地形”和“动态材料变化”等测试中表现出比传统机器人更高的稳定性和灵活性。关键指标的量化性能证明了该系统的优势。Exbody2的机器人不再是“机械螺丝工人”,而是“智能工作伙伴”,无论是家庭服务场景还是工业生产场景,Exbody2都给人形机器人带来了新的可能性。
本文来源:腾讯科技