루밍 로보틱스, 세계 최초 배낭형 UMI 데이터 수집 장치 출시
전문가 해설
저의 시각으로 볼 때, 이번 발표는 체화지능 산업의 가장 큰 병목인 데이터 부족 문제를 해결하려는 시도로 해석됩니다. 대규모 언어모델은 인터넷의 방대한 텍스트 데이터를 기반으로 발전했지만, 로봇과 같은 물리적 세계의 인공지능은 실제 작업 데이터를 확보하기 어렵다는 한계가 있었습니다. 루밍은 배낭형 장치를 통해 다양한 실제 환경에서 데이터를 수집하고, 이를 표준화·상품화하여 누구나 활용할 수 있게 함으로써 산업 전반의 진입 장벽을 낮추려 하고 있습니다.
최근 중국 내 관련 뉴스에서도, AI와 로봇 분야 기업들이 데이터 인프라 구축을 핵심 경쟁력으로 삼고 있다는 점이 강조됩니다. 예컨대 36Kr와 차이신 보도에 따르면, 여러 로봇 스타트업이 산업 현장과 생활 공간에서 데이터를 수집·정제하는 플랫폼을 구축하고 있으며, 이는 향후 AI 모델의 성능을 좌우하는 결정적 요소로 평가됩니다. 특히 리창 총리가 최근 ‘신질적 생산력’을 강조하며 첨단 제조업과 AI 융합을 국가 전략으로 제시한 것도, 데이터 기반 산업 생태계 구축과 맞물려 있습니다.
요약
중국 로봇 스타트업 루밍(鹿明)이 세계 최초 배낭형 UMI 데이터 수집 장비를 출시하며, 2026년까지 1만 대 배치를 통해 구현체 지능용 대규모 데이터를 수집한다고 발표했습니다. 기존 원격조작 방식 대비 5배 빠르고 5-8배 저렴한 데이터 수집이 가능하며, 연간 100만 시간 규모의 데이터 생산 능력 구축을 목표로 합니다. 회사는 데이터를 표준화된 상품으로 판매하는 '데이터 슈퍼마켓'도 구축했습니다.
作者丨苏建勋
在具身智能领域,“搞数据”这个事儿,可能是为数不多的共识。
依靠训练巨量数据,大语言模型诞生了Chatgpt,“Scaling Law”也成了AI人的信仰,可在具身智能所属的物理世界,没有互联网上海量的数据参照。不论是人,还是机器人,在现实中的数据量,都不足以复现GPT时刻。
所以,数据怎么搞,能搞到多少,以及要让数据有质量,就成了具身智能从业者当下最重要的工作之一。
最近,就有一家机器人公司想在数据采集上“整点花活儿”。鹿明机器人发布了全球首款背包版UMI数采设备FastUMI Pro(背包版),并计划在2026年投放1万台设备,在工业、家庭、酒店、餐馆、商场、办公等六大真实场景开展系统性数据采集。
全球首款背包版UMI数采设备:鹿明FastUMI Pro(背包版)
简单解释一下“UMI(通用操作接口)”:UMI是斯坦福大学、哥伦比亚大学与丰田研究所联合提出的低成本数据收集与学习框架。区别于市场同行的遥操数采,UMI可以与机器人本体解耦,这就意味着训练出的数据,可以不仅适用于某一家/个机器人形态。
在2026年初的一次媒体交流会上,鹿明机器人创始人兼CEO喻超也聊到UMI和遥操的效率与成本对比:
“同样是像叠衣服这样的事情,遥操作数据采集,需要花 50 秒,成本是3-5元,如果是用FastUMI Pro的方式去采集,只要 10 秒,成本<0.6元,这样的话其实采集的效率能大大提升,成本更低。”
鹿明机器人成立于2024年9月,创始人喻超是前追觅具身机器人业务负责人,拥有近10年具身机器人研发经验,主导了小米CyberDog的研发和千台量产。联席CTO丁琰是大陆最早做UMI的人,首次将UMI从实验室带向工业界。
有量,也要有质
2025年,鹿明通过自建数采中心的方式,已实现10万小时的数据产能。喻超判断,2026年,头部具身模型的数据规模预计100万小时起。
而鹿明在2026年最重要的目标,就是建立年采集百万小时的UMI数据产能。这意味着,鹿明需要用更具规模化的手段,采集更多数据。
“机器人训练数据本不应该如此昂贵和稀缺。人类在物理世界作业过程中产生的数据无处不在,只是没有被很好地收集。”喻超表示。
背包版FastUMI正是为解决这一问题而生——它是一款便携的标准数采工作站,可将真实场景操作高效转化为高质量训练数据。
此前具身数据采集,大多依靠实验室或单一场景采集,这就会导致一个问题:机器人在采集时往往只在一个场景下重复几个动作,这样得到的数据就会缺乏多样性,也会影响模型的泛化能力。
因此,鹿明机器人希望采用更轻便的数据采集方式,将采集工具直接装进背包,让真实场景的数据采集门槛更低。
在具体场景上,鹿明机器人希望覆盖工业、家庭、酒店、餐馆、商场、办公六大核心场景,细分30个小类任务,构建结构化、多维度的操作数据体系。
“采–训–推”一体化闭环能力是鹿明数据基础设施的核心。此次规模化数据采集的启动,正依托于这一已全面打通的基建体系:依托FastUMI Pro,鹿明双臂具身机器人MOS在5小时内完成从“数据采集-策略训练-模型推理”的工厂质检全流程验证;FastUMI Pro在合肥实地部署后,仅用7小时便跑通真实场景下的采集、训练与部署推理。
FastUMI Pro在分拣零部件任务中,完成“数据采集-策略训练-模型推理”闭环
要训模型,数据先行
有了背包式的采集工具以外,鹿明还做了一件事,他们建了一个“数据超市”,把采集到的数据变成了可以流通的标准产品,让客户可以直接在官网上采购标准化操作数据。可以看出,作为一家具身智能公司,鹿明当下的公司战略重点,都围绕“数据”。
鹿明机器人的一系列动作背后,实际上反映了具身智能当下“最痛”的业务需求。
在年初的媒体沟通会上,鹿明机器人联席CTO丁琰就对《智能涌现》等媒体分享了他对于数据和模型的感悟。
“我就是做模型出身的,我之前一直在训模型,当时我们在做的时候就发现一个很大的问题。“丁琰说到,”要想训一个非常好的模型,必须要有一个很好的数据管线,包括数据生产、数据评估、数据筛选,建立的过程本身就需要时间。“
在摸清行业真实发展现状后,丁琰和团队当时就决定,模型和数据二选一的话,肯定先选数据,不能上来就训模型。
”因为模型架构拼到最后,大家拼的不是模型架构,而是模型数据的质量,这是一个行业的共识。“丁琰说到。
具身智能的能力上限高度依赖真实操作数据的规模与质量,当通用数据可以像硬件一样在线下单,行业模型训练门槛被显著拉低,具身智能才能从定制化探索走向工程化生产。
从“万台设备同步开采”到“通用数据电商下单”,鹿明正将“无处不在却未被收集”的物理世界操作数据,变为可规模供给的标准化基础设施,并以此构建数据驱动的生态系统。当数据不再稀缺,机器人才真正走向通用。
end