징둥, 초고화질 수집 단말기 JoyEgoCam, 맞춤형 대형 모델 JoyAI-RA 공개
전문가 해설
구체적인 인공지능은 실험실에서 실제 응용으로 나아가고 있지만, 데이터 병목 현상이 업계 발전을 제약하고 있습니다. 4월 16일, 징둥은 전 과정을 아우르는 맞춤형 스마트 데이터 인프라를 출시하고, 자체 개발한 초고화질 수집 단말기 JoyEgoCam, 맞춤형 대형 모델 JoyAI-RA 및 맞춤형 스마트 데이터 거래 플랫폼 등의 제품을 선보였습니다. 관련 보고서에 따르면, 중국의 구체적인 스마트 산업 시장 규모는 2030년에 4000억 위안에 이를 것으로 기대됩니다. 고품질 데이터 공급은 산업 발전을 촉진하는 중요한 요소입니다.
징둥은 향후 2년 내에 세계 최대의 맞춤형 데이터 수집 센터를 건설할 계획이며, 최대 60만 명이 대규모 데이터 수집 활동에 참여하도록 독려하여 물류, 소매, 의료 등 다양한 상황에서 1000만 시간의 실제 비디오 데이터를 수집하고, 모델의 반복 및 최적화를 가속화할 것입니다. 이 데이터는 AI 데이터 호수 플랫폼을 통해 세척되고 사전 라벨링된 후, JoyBuilder 시뮬레이션 플랫폼을 사용하여 고현실적인 시뮬레이션 데이터를 생성합니다.
징둥그룹 기술위원회 주석인 차오펑은 산업 훈련에서 일반화 능력을 갖춘 대형 모델을 훈련하려면 최소 1000만 시간의 실제 상황 데이터가 필요하며, 현재 시장에서 사용 가능한 데이터 세트는 수십만 시간에 불과하다고 지적했습니다. 현재 데이터 세트는 장면 다양성 부족과 본체 간 이동의 어려움 등의 문제가 있어, 진정한 일반화 능력을 가진 모델 훈련을 지원하기 어렵습니다.
징둥은 또한 맞춤형 스마트 데이터 거래 플랫폼을 출시하여, 2000시간 고정밀 라벨링 데이터 세트를 첫 번째로 개방했습니다. 또한 협력 파트너의 데이터 자원을 통합하여 업계 내 데이터 고립과 표준 불일치 문제를 해결하고자 합니다.
징둥은 향후 2년 내에 세계 최대의 맞춤형 데이터 수집 센터를 건설할 계획이며, 최대 60만 명이 대규모 데이터 수집 활동에 참여하도록 독려하여 물류, 소매, 의료 등 다양한 상황에서 1000만 시간의 실제 비디오 데이터를 수집하고, 모델의 반복 및 최적화를 가속화할 것입니다. 이 데이터는 AI 데이터 호수 플랫폼을 통해 세척되고 사전 라벨링된 후, JoyBuilder 시뮬레이션 플랫폼을 사용하여 고현실적인 시뮬레이션 데이터를 생성합니다.
징둥그룹 기술위원회 주석인 차오펑은 산업 훈련에서 일반화 능력을 갖춘 대형 모델을 훈련하려면 최소 1000만 시간의 실제 상황 데이터가 필요하며, 현재 시장에서 사용 가능한 데이터 세트는 수십만 시간에 불과하다고 지적했습니다. 현재 데이터 세트는 장면 다양성 부족과 본체 간 이동의 어려움 등의 문제가 있어, 진정한 일반화 능력을 가진 모델 훈련을 지원하기 어렵습니다.
징둥은 또한 맞춤형 스마트 데이터 거래 플랫폼을 출시하여, 2000시간 고정밀 라벨링 데이터 세트를 첫 번째로 개방했습니다. 또한 협력 파트너의 데이터 자원을 통합하여 업계 내 데이터 고립과 표준 불일치 문제를 해결하고자 합니다.
💡 전체 링크 인프라는 데이터 수집, 처리 및 응용을 포괄하는 완전한 시스템을 의미하며, 징둥이 출시한 이 시스템은 구체적인 스마트 발전에서 직면한 데이터 병목 문제를 해결하는 것을 목표로 하고 있습니다. 이 체계는 초고화질 수집 장비, 대규모 모델 훈련 도구 및 데이터 거래 플랫폼 등을 포함하며, 기술 반복과 최적화를 가속화하는 데 도움이 됩니다.
具身智能正从实验室走向工厂、家庭和医院,但数据这个瓶颈制约了行业的发展。4月16日,京东推出覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施,并对外展示了自研超高清采集终端JoyEgoCam、具身大模型JoyAI-RA、具身智能数据交易平台等,试图为陷入数据困局的具身智能企业上下游提供底层支撑。根据相关报告,我国具身智能产业市场规模有望在2030年达到4000亿元。高质量数据的供给是产业规模化落地的关键。
3月,京东宣布将建成全球最大具身数据采集中心;4月16日,京东发布首个具身数据全链路基础设施,打通从数据采集到模型测试的全流程闭环,将原始杂乱数据精炼为驱动模型进化的高价值“数据燃料”。
以此为基础,京东将构建全球规模最大的具身智能数据采集中心,发动最多60万人进行“大规模数据采集行动”,在两年内积累1000万小时人类真实场景视频数据,加速真实场景下的模型迭代优化,为机器人企业、具身模型研发机构、汽车厂商、医疗机构等各行业客户提供全流程数据服务。
在采集端,京东云自研的可穿戴式超高清采集终端JoyEgoCam,从清晰度、精准度、便携性、稳定性四个维度保障了源头数据质量,可在物流、零售、医疗、家庭等多种场景下“即戴即采”。
采集后的数据汇入AI数据湖平台,经PB级吞吐能力自动完成清洗、对齐、转换与预标注,再通过JoyBuilder仿真平台批量生成高逼真仿真数据,实现人类操作数据向仿真操作数据、真机操作数据的转换与泛化扩增。
“硬件发展很快,但大脑模型缺乏数据支撑,很多机器人能唱歌跳舞,却无法应用在真实的生产环节。”京东集团技术委员会主席、京东云总裁曹鹏在发布会上指出,行业训练一个具备泛化能力的具身大模型至少需要1000万小时真实场景数据,而目前市场可用数据集仅有几十万小时,“数据已经成为制约整个具身智能行业向前发展的关键痛点”。曹鹏强调,现有数据集普遍存在场景多样性不足、本体依赖性强、跨本体迁移困难等问题,难以支撑真正具有泛化能力的模型训练。
数据背后是京东在零售、物流、工业、健康等场景的资源积累——超过3600个仓库、过万线下门店、20多万药房以及5万家政人员的服务网络构成了天然的数据采集场域。
除了自建采集体系,京东还上线了具身智能数据交易平台,首批定向开放2000小时高精标注数据集,打通数据合规交易通道。曹鹏表示,该平台一方面开放京东自身采集的高精标注数据,另一方面希望聚合合作伙伴的数据资源,“光靠我们自己一家来做肯定做不好,需要更多伙伴一起把数据在数量、丰富度和质量上都做提升”。这一开放策略试图回应行业内数据孤岛、标准不一、难以流通的普遍困境。
许久未见的成交喜报,近期在北京楼市集中出...
一边是租户拿不回来的押金,另一边是房东收...
在刚刚过去的周末,北京迎来了名副其实的“...
第三套上市标准启用后不久,创业板深化改革...
在大六座SUV赛道竞争白热化,理想L9、问界M...
4月14日,国务院办公厅印发《关于健全药品...
数月前以一己之力搅动硬件及互联网市场的“...
4月13日,人民银行官网发布2026年一季度金...
羊奶粉龙头宜品营养科技(青岛)集团股份有...
2026年4月24日—5月3日,2026年(第十九届...
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1京公网安备11010502045556号互联网新闻信息服务许可证11120220001号
3月,京东宣布将建成全球最大具身数据采集中心;4月16日,京东发布首个具身数据全链路基础设施,打通从数据采集到模型测试的全流程闭环,将原始杂乱数据精炼为驱动模型进化的高价值“数据燃料”。
以此为基础,京东将构建全球规模最大的具身智能数据采集中心,发动最多60万人进行“大规模数据采集行动”,在两年内积累1000万小时人类真实场景视频数据,加速真实场景下的模型迭代优化,为机器人企业、具身模型研发机构、汽车厂商、医疗机构等各行业客户提供全流程数据服务。
在采集端,京东云自研的可穿戴式超高清采集终端JoyEgoCam,从清晰度、精准度、便携性、稳定性四个维度保障了源头数据质量,可在物流、零售、医疗、家庭等多种场景下“即戴即采”。
采集后的数据汇入AI数据湖平台,经PB级吞吐能力自动完成清洗、对齐、转换与预标注,再通过JoyBuilder仿真平台批量生成高逼真仿真数据,实现人类操作数据向仿真操作数据、真机操作数据的转换与泛化扩增。
“硬件发展很快,但大脑模型缺乏数据支撑,很多机器人能唱歌跳舞,却无法应用在真实的生产环节。”京东集团技术委员会主席、京东云总裁曹鹏在发布会上指出,行业训练一个具备泛化能力的具身大模型至少需要1000万小时真实场景数据,而目前市场可用数据集仅有几十万小时,“数据已经成为制约整个具身智能行业向前发展的关键痛点”。曹鹏强调,现有数据集普遍存在场景多样性不足、本体依赖性强、跨本体迁移困难等问题,难以支撑真正具有泛化能力的模型训练。
数据背后是京东在零售、物流、工业、健康等场景的资源积累——超过3600个仓库、过万线下门店、20多万药房以及5万家政人员的服务网络构成了天然的数据采集场域。
除了自建采集体系,京东还上线了具身智能数据交易平台,首批定向开放2000小时高精标注数据集,打通数据合规交易通道。曹鹏表示,该平台一方面开放京东自身采集的高精标注数据,另一方面希望聚合合作伙伴的数据资源,“光靠我们自己一家来做肯定做不好,需要更多伙伴一起把数据在数量、丰富度和质量上都做提升”。这一开放策略试图回应行业内数据孤岛、标准不一、难以流通的普遍困境。
许久未见的成交喜报,近期在北京楼市集中出...
一边是租户拿不回来的押金,另一边是房东收...
在刚刚过去的周末,北京迎来了名副其实的“...
第三套上市标准启用后不久,创业板深化改革...
在大六座SUV赛道竞争白热化,理想L9、问界M...
4月14日,国务院办公厅印发《关于健全药品...
数月前以一己之力搅动硬件及互联网市场的“...
4月13日,人民银行官网发布2026年一季度金...
羊奶粉龙头宜品营养科技(青岛)集团股份有...
2026年4月24日—5月3日,2026年(第十九届...
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1京公网安备11010502045556号互联网新闻信息服务许可证11120220001号