선전에서 세계 최초 맞춤형 스마트 해커톤 개최
전문가 해설
Bilibili에서 33만 명의 팔로워를 보유한 '퉁지쯔 호형'은 "이렇게 부유한 싸움은 없었다. 참가 선수들은 거의 모두 00년대생이며, 그중 "MVP"라는 팀이 현재 1위를 차지하고 있습니다. 그 팀의 팀장은 연속 창업자로, 5090GPU와 여러 종류의 로봇 팔을 자체 준비하고 있으며, 팀원들은 각각 선전대학교와 홍콩과기대학교 출신입니다.
경기는 참가자가 3일 이내에 데이터를 수집하고 알고리즘을 적응시켜 로봇 팔이 특정 작업을 완료하도록 요구합니다. 예를 들어, 물체를 인식한 후 알파벳 블록으로 영어 이름을 쓰거나 type-C 라인을 포트에 삽입하는 것입니다. 주최 측 독립변수 로봇 창립자 왕첸은 규모가 너무 클 것을 우려하지만, 실제로 유사한 경기 사례가 없다고 밝혔습니다. 그는 경기의 난이도가 매우 높지만, 72시간 내에 로봇 팔에게 환경 인식, 결정 및 조작을 가르쳐 기술 발전을 촉진할 수 있다고 언급했습니다.
구현 지능이 현재 직면한 문제 중 하나는 '가짜'입니다. 많은 전시된 로봇들이 특정 환경에서만 작동할 수 있으며, 조건이 변경되면 대응할 수 없습니다. 이번 대회는 참가자들이 데이터를 수집하고 하드웨어 구성을 수정하여 모델의 일반화 가능성을 높일 수 있도록 허용합니다. 대회는 A/B 순위를 설정하며, 그중 B 순위는 로봇 팔이 완전한 무작위 환경에서 임무를 완수하도록 요구하여 현실적인 도전에 더 가깝습니다.
💡 고성능 하드웨어와 오픈 소스 모델의 결합 사용에 주목하는 것은 미래 로봇 개발이 더욱 강력한 계산 능력과 개방형 기술 생태계에 의존하게 될 것임을 예고하며, 이는 기술 혁신을 가속화하고 비용을 절감하는 데 유리합니다.
요약
2026年3月29日下午5点,在深圳科创学院四楼举行的“全球首届具身智能开发者大会”上,20组参赛选手已经连续开发了60个小时。现场弥漫着咖啡和冷气的味道,随处可见未吃完的奶茶和果切,楼道里和墙角支着帐篷供选手补觉。与传统的黑客松不同,此次比赛提供了近百台高性能六轴机械臂以及100+ PFLOPs的算力支持,并有多种开源基模可供选择。 在B站拥有33万粉丝的“同济子豪兄”感慨道:“就没打过这么富裕的仗!”参赛选手几乎都是00后,其中一支名为“MVP”的队伍暂列第一。该队队长是一名连续创业者,自备5090GPU和多款机械臂,队员分别来自深圳大学和香港科技大学。 比赛要求选手在三天内通过采集数据、适配算法让机械臂完成特定任务,如识别物体后用字母积木拼出英文名称或把type-C线插进端口。主办方自变量机器人创始人王潜表示,尽管担心规模过大,但确实没有类似的比赛先例。他提到比赛难度很高,但在72小时内教会机械臂识别环境、做决策和操作,能推动技术进步。 具身智能目前面临的一个问题是“假”,许多展示的机器人在特定环境下才能工作,一旦改变条件便无法应对。此次大赛允许选手采集数据并修改硬件配置,以提高模型泛化性。比赛设立A/B榜,其中B榜要求机械臂在完全随机环境中完成任务,更贴近现实挑战。
2026年3月29日下午5点,在我们抵达深圳科创学院四楼时,参加“全球首届具身智能开发者大会”的20组选手,已经在这里持续开发了60个小时。
现场弥漫着一股咖啡混合着冷气的味道,随处可见没吃完的奶茶和果切,楼道里和墙角支着一个个帐篷,有选手在里面补觉,“前一天熬到凌晨4点”。
图片由智能涌现拍摄
和开发应用/软件的黑客松不同,在这场具身智能开发者大会上,看得见的,有近百台高性能六轴机械臂;看不见的,背后还有100+ PFLOPs的算力支持,以及自变量WALL-OSS、Pi0.5、英伟达DreamZero等开源基模可供选择。
图片由官方提供
“就没打过这么富裕的仗!”在B站有33万粉丝的“同济子豪兄”,在看到主办方提供的赛事支持后这样感慨。
参赛选手几乎清一色的00后。现场一支名为“MVP”的队伍在当天暂列第一,队长是一名连续创业者,有丰富的大赛经验,称自己“自备5090GPU和多款机械臂”,另外两名队员分别来自深圳大学和香港科技大学。
选手要做的,是在三天时间里,通过采集数据、适配算法,让机械臂尽可能实现单个任务的执行成功,比如把草莓苹果装进不同的篮子;或者是识别物体后,用字母积木拼出该物体的英文名称,还有更难的——把type-C线插进端口。
“之前我们叫全球首届,还担心太大了,后来看了看,确实不管国内还是国外,都不曾有过这样规模的比赛。”作为主办方,自变量机器人创始人&CEO王潜在决赛日的发言中说。
72小时内,选手需要教会机械臂识别环境、做决策、懂操作,难度颇高。王潜自己也说,“这事儿上手确实挺难”,但他也提到,把参赛时间极致压缩,能推大家一把。
自变量创始人王潜
回归真实
具身智能,当下有一个症结:“假”。
你看到的很多机器人进厂打工拧螺丝,或者在零售场景下取货收款,都是在设定好程序、环境前提下的摆拍,一旦换个场地、光线,机器人便手足无措。
大赛也“不够真”。自变量CTO王昊就对《智能涌现》说,行业目前几类赛事,有的提供纯仿真环境,虽然能控制变量,让参赛者更易上手,但离现实世界太远;还有的赛事只给选手提供数据,但所有评测过程均由主办方完成。
“我们允许选手采集数据和修改硬件和各种环境配置,让大家在模型泛化性上充分理解。”王昊说。
此次比赛设立A/B榜,选手需要从套环(抓取)、按指令分类水果(语言理解)、插电源线(精细操作)、拼写单词(长时序决策)四个中,选择针对一个任务持续攻关。
而A/B榜的差异是,A榜中,选手可以按照自己设定好的环境、任务,完成指定动作即可;但B榜,需要按照完全随机的环境,让机器完成任务。
举个例子,A榜里的套环,选手可以把木环放在套杆左边,一直按照同一个位置,让机械臂识别并完成套取;但在B榜里,审核员会随机把木环放在任何位置,还会改变灯光、桌面颜色等环境指征,看机器能否在随机条件下完成任务。
也就是说,A榜像开卷考试,考察的是选手对同一个题型的复刻能力、稳定性;但B榜,就是用纯黑盒的题型,考验选手训练的模型究竟有多少“泛化性”。
设立A/B榜,也是为了让选手回归真实,让选手不单单为了“刷榜”,只使用少量数据来优化特定场景,忽略了模型整体泛化性。
“这个比赛不想让大家停留在仿真、虚拟世界的画面里,而是上手动起来,体验物理世界的复杂性。”自变量算法合伙人甘如怡说到。
回到现实
在这场具身智能开发者大赛中,选手们摸到真实的机器,采到真实环境下的数据,得到了真实场景的模型反馈,具身智能得以回归真实。
而下一步,就是让机器人的智能,回到现实。
开发者黑客松代表的,是技术极客的想象,但技术,总要落地才有价值。
这次大赛的四个类目中,套环考验的抓取能力;按指令分类水果中包含语言理解;插电源线中对柔性物体的精细操作,以及拼单词背后的长序决策能力,都是机器人落地工厂、家庭等现实场景中必备的能力。
图片由官方提供
在这场赛事举办前夕,自变量还宣布,与58到家合作,在深圳推出智能保洁服务,让全球首个机器人保洁员上岗。
“家庭是具身智能的圣杯,它代表最广泛、最开放的环境和任务,解决了家庭任务,就代表模型可以实现完全泛化。”王昊如此形容。
必须承认的一个事实是,让机器人完全替代人类完成保洁,还不现实,在自变量与58到家的演示视频中,机器人只能实现整理物品、清洁桌面等基础动作,而像收纳大件床单这种复杂动作,还需要和真人协作完成。
那么,机器人进家庭的时间,是否应该等模型足够成熟后,再逐步实现呢?王昊并不认同这个结论。
“一开始就直面最复杂最开放的场景,才能让模型智能水平,提升到可以解决丰富场景的能力。”王昊说,“不管从什么时候开始,越早开始越好。”
不论是开发者大赛还是机器人落地,自变量的思路都相当一致。
具身智能是一个复杂的系统性工程,从数据、算法、模型工具、训练范式,行业都没有一个绝对共识,而自变量的法则是,鼓舞更多的人参与进来,在尝试中,让模型与智能迭代。
在解释举办比赛的初衷时,王潜也用“openclaw”给台下的开发者们举例:“小龙虾为什么火,并不是因为一群专业人士在做,而是无数个人开发者、无数小团队一起,把它推成了一个庞大的生态。”
“我希望能做到具身智能的平权。”王潜说。