
“目前机器人其实可以学习人的任何动作。”
前不久,在北京举办的2026人形机器人与具身智能标准化年会上,宇树科技创始人王兴兴用“任何动作”,概括机器人的能力边界。而要实现这一效果,需提前采集真人数据进行训练。
在机器人的“成长”过程中,采集真人数据为何如此关键?海量数据又如何赋予机器以“人”的灵性?这些问题的答案,正随着一座座数据采集训练场的落地而逐渐清晰。

训练场上:1250遍“手把手”陪练
春日的青岛崂山区,国家高端智能化家用电器创新中心里,正紧锣密鼓地推进一项关键项目:机器人的真机数据采集与“岗前教育”。
今年1月,青岛市人形机器人数据采集训练场在此启用。整层室内环形训练场被错落切割为厨房、商超、汽车制造等7个实景,每块置景内均有1—2位真人“老师”,耐心地“手把手”教导31个名为夸父的机器“学生”。
均龄20出头的年轻数采师头戴VR设备,紧握手柄,耐心而小幅度地比划着行走、蹲起、抓取等基础动作。银黑相间的“夸父”们则略显生涩地同步扭动关节,尝试完美复刻。
这里鲜有言语声,偶尔,“咚”的一声闷响会打断这份安静——新手老师动作过急,尝试练习平稳行走的机器学生便笨拙栽倒。
这些动作并非随性编排,而是遵循严格的工业标准。小组长刘文硕告诉记者,训练流程一般是甲方提出需求,位于北京的研发部门将其拆解为具体动作步骤,最终“发包”至各地训练场。

训练师们领到的任务通常是10秒至2分钟长的演示视频,他们须在时限内高精度还原视频动作,并重复单一任务至少1250遍,以便机器学生完美复刻。“动作不到位就是无效数据,直接作废。”刘文硕说。
与沉默的机器学生为伴,每日枯燥地重复单一动作,“老师”秦小杰仍显得兴致勃勃,“一想到未来大街上的机器人都是自己亲手教出来的,还是很有成就感的。”
然而,看似简单的动作,却屡屡让满身前沿科技的金属身躯“翻车”,“比如拿个杯子,机器人的手掌有时会整个翻转,非常别扭。”
灵巧手,在业内被认为决定着人形机器人的功能上限。秦小杰有时会握住“学生”这双分布着数百个感应点的修长铁手,感受相似形态下悄然生出的亲密。
人类从具备抓握功能到熟练使用工具,走过了逾百万年的漫长进化;而今,这一进化历程则被压缩至以月、年为单位的“商业催熟”中。
灵巧手并非唯一的关卡。卡住人形机器人商业化步伐的,更多的是一颗能独立决策、应对未知的聪慧“大脑”。
因此,海量训练的深层目标,是赋予机器人举一反三的“泛化能力”。“数据能够帮助机器人学习环境变化规律和自身行为策略。”山东大学控制科学与工程学院教授王元哲解释。
“结构化的数据集被喂给大模型后,将迭代出更智慧的机器‘大脑’。”青岛市人形机器人数据采集训练场总经理李彦杰进一步介绍,目前,业界突破主要聚焦两个方向:负责决策感知的“大脑”与负责运动控制的“小脑”。
沿循这两个方向,业界分化出不同研发重心:一派专注硬件动作表现,被称作“本体派”;另一派致力于提升其智商,即“AI派”。
巧妇难为无米之炊,受限于数据短缺,AI派迟迟未能迎来自己的革命性进化。正如王兴兴所言,“谁能把机器人用的大模型做出来,谁就是全世界最厉害的AI和机器人公司。”

公共空间中:让数据走出“孤岛”
对高质量数据的渴求,已成为行业的共同诉求。尽管自家机器人已在简单动态场景中表现出一定的自主心智,松延动力负责人仍表示:“当前产业的最大瓶颈,在于缺乏高质量的真实场景数据集。任何实质性突破都依赖于此,但行业尚未形成规模化积累。”
大型训练场的出现,恰恰是为了实现“规模化的积累”。山东大学控制学院机器人工程系副主任张国腾说,“这是把数据采集从‘手工作坊’升级为更标准化的‘数据工程’。”

当下,不同品牌、构型的机器人,仅遵循各自软硬件体系,数据质量参差不齐,未形成通用的数据语言,各家形同小小“孤岛”,直接制约着行业发展效率。
公共训练场的价值在于,它为各类机构提供了一个可以互动、达成通约的平台性空间,从而避免重复建设,并最终走出“各自为战”的封闭叙事。“我们已经开源了部分数据集,期待能激发更多创新。”李彦杰说。
即便训练失败,在此亦有价值——失败能暴露传感噪声、接触动力学、控制饱和、软硬件延迟等真实问题,往往更有含金量。
进入2025年后,各地对于建设训练场的热情逐步迸发。去年1月,上海浦东新区率先落子,建成全国首个异构人形机器人训练场;北京、合肥、无锡等地步伐紧跟。在山东,除青岛外,济南平阴县于去年12月亦宣布启用面积达4000平方米的训练场。
“我们的核心目标之一,是实现产业场景的落地。”李彦杰表示,青岛这座训练场定位清晰,即面向具有本土特色的海洋、康养、新零售等产业开展实训,精准服务一线需求。
当市场尚就“人形”是否必要争论不休时,部分“夸父”机器人已悄然现身服装、汽配等场景中,开启了进厂“打工”生涯。

实验室里:在仿真中“穷尽可能”
为了让机器人“耳聪目明”,在山东大学创新大厦内,另一条技术路径正在探索中:构建于仿真世界的推演训练。
这里同样孕育着激动人心的成果。7层的机器人中心实验室孵化出了“优宝特”这一山东名片;5层的视觉感知与智能系统实验室则与宇树科技成立了人形机器人联合实验室,攻关双足机器人关键技术。
“企业提供机器人作为硬件平台,我们就在其中刷程序,调优软件性能。”张国腾认为,高校受限于资金,难以购买昂贵的算力和硬件,企业恰好可以提供这些重资产,以换取智力支持。
更重要的是,在行业通用标准尚未确立的当下,哪家机器人能够作为高兼容的“底座”支撑更多软件开发,谁就可能在未来的标准之争中占得先机。

与训练场不同,实验室里少有完整的机器人,取而代之的是拆得七零八落的零部件。来自机器人工程、电子信息、物理等专业的硕博学生埋首仿真软件,一遍遍修改参数、切换视角、调试细节,以使模拟空间无限逼近物理现实。
“现有的人形机器人,空间理解能力比较差,这是很大一块短板。”张国腾举例,面对一张低矮的桌子,小猫小狗都知道低头穿过,机器人却会将其视为整块障碍物而选择绕行。
仿真训练的本质,是一种“穷尽可能性”的探索。机器人工程专业大三学生赵凯涛解释:“我们会在仿真环境里创建任何可能出现的地形,让机器人一遍遍试错,摔倒就惩罚,成功就奖励。”
凭借这套虚拟的奖惩机制,仿真世界中成百上千个机器人正日复一日“变聪明”,这常让整个实验室兴奋不已。
那么,实景与仿真训练,孰优孰劣?
张国腾认为,两者并无高下之分。仿真训练更灵活、方便、低成本,但虚拟环境与现实世界始终存在鸿沟。实景数据则是缩窄这道鸿沟的最佳标尺。
一个更务实的策略是:仿真用于快速筛选方向,少量高质量的真机数据,则用于最终的校准与验证。
“最希望具身智能大模型从‘读万卷书’过渡到‘行万里路’。”对未来,张国腾不免畅想,在充沛数据的支持下,拥有聪明“脑袋”的机器人,终将走出实验室,与人类一同前行万里。

