本文基于诺亦腾联合创始人、CTO戴若犁博士于2024年10月开源创新大会的主题演讲修改而成,亦为2024年8月世界机器人大会期间发表的《用动作捕捉技术构建具身智能数据工厂》一文的续篇。
数据是横亘在具身智能规模化落地面前的一座大山。在过去的两年里,诺亦腾深入机器人行业,在商业一线感知水温,在与合作伙伴携手前行的过程中发现了具身智能行业缺数据,缺高质量数据的现状。
以可控的成本建设高质量、大规模数据集并以此树立技术门槛,已逐渐成为整个行业的战略共识。然而,其中真正的挑战,仍未被业界充分认识。
戴博士基于服务具身智能行业客户的一线落地经验,针对具身智能数据工厂建设中有关数据采集、设备选择、管理优化、数据上规模等实际的难点与挑战,分享了他的经验与洞察。欢迎转载分享。
感谢各位。
在咱们这个领域,快速、高效积累大规模高质量数据集的重要性已经被认可。我此前曾经围绕「利用动作捕捉技术建设具身智能数据工厂」这个话题分享过一些经验,关于动作捕捉、高精度追踪技术在具身智能领域中怎么用,典型的遥操作数据采集工作流是什么样子的,四种数据生产方式的特点和长短板都在哪里等。在那之后,诺亦腾与一些有远见有实力的机构、公司积极展开合作,获得了许多第一手的珍贵实践经验。感谢他们的信任,也感谢他们允许我把部分「最佳实践」信息面向行业做有限度的披露与分享。