近日,具身智能公司 RoboScience 完成数千万元种子轮融资,由零一 独家投资。
北京机科未来科技有限公司成立于 2024 年 12 月,由前苹果技术主管田野与新加坡国立大学助理教授邵林共同创立。创始人兼 CEO 田野,曾以专业第一从中科大物理系毕业,后赴斯坦福人工智能实验室深造,师从吴恩达。田野曾是苹果总部最年轻的主任工程师之一。在苹果的 7 年时间中,他作为技术主管,带领团队打造了苹果的机器学习平台,支撑了相机、Siri、Apple Intelligence 等 AI 应用和 CoreML、ARKit、Vision Framework、NLP framework 等 AI 生态框架,推出多项世界领先的端侧训练和推理技术,服务了数亿用户和数十亿设备,具有把 AI 技术落地到软硬件产品的丰富经验。
另一创始人兼首席科学家邵林,目前于新加坡国立大学担任助理教授,深耕具身智能领域。此前,邵林博士毕业于斯坦福大学,师从 Jeannette Bohg 和 Leonidas J. Guibas 教授。2023 年,邵林合作发表的论文提出 SAM-RL 方法,有效解决了对世界进行高效建模的问题,入围了国际机器人顶会 RSS 的最佳系统论文奖。2024 年,邵林带领团队提出了 D ( R,O ) Grasp 方法,通过创新性地建立机器手与物体在抓取姿态下的交互模型,成功实现了对机器手与物体几何形状的高度泛化能力,并极大提升了抓取速度,重塑了跨智能体灵巧手抓取,获得 CoRL MAPoDeL Workshop 最佳机器人论文。
田野与邵林合作推出的统一操作大模型,是视觉语言大模型与物理世界的桥梁,已完成了三个维度的泛化:指导任意的机器人,操作任意物体,完成任意任务。此外,RoboScience 已建立规模化获取并使用仿真数据、视频数据和真实数据的系统,覆盖了日常生活中可见的各种类型及各种维度的物体和任务,提升了数据质量,降低了数据成本。
技术路线上,RoboScience 从成立之初就坚定地选择做快慢脑分层模型,这与海外明星公司 Figure 的探索方向不谋而合。另一明星公司 Physical Intelligence 最新发布的模型也从端到端 VLA 模型转为了分层模型。不同于大语言模型可以从网络上抓取数据,数据来源问题一直是具身智能发展的阻碍。RoboScience 已建立规模化获取并使用仿真数据、视频数据和真实数据的系统,覆盖了日常生活中可见的各种类型及各种维度的物体和任务,提升了数据质量,降低了数据成本。
商业化方面,基于其技术的高度泛化能力,RoboScience 的产品将根据落地场景的具体需求,高效适配不同配置和性能的硬件,拓展落地场景、提升落地效率。之所以选择这样的开发路径,基于 RoboScience 团队对于市场的洞察:一是由于随着具身智能的发展,未来不同场景下需要不同的硬件设备,很难用一个统一的硬件来覆盖机器人需要完成的所有任务。二是背靠中国的供应链优势,硬件成本正在快速下降,此时推出通用操作的软件模型,有利于将供应链优势在具身智能领域快速发挥出来。三是由于软件研发迭代速度显著快于硬件,对于 RoboScience 这样在软件方面有丰富产业经验与学界技术支持的团队而言,与硬件厂商合作来做不同场景无疑是将优势最大化的选择。
来源:猎云网