10月18日,《北京自动驾驶“数据拼车”众源共享新范式》在2025世界智能网联 大会闭幕式发布。发布指出,北京通过自动驾驶“数据拼车”众源共享新范式,实现供需精准匹配,帮助企业低成本、高效率、安全获取所需数据。北京数据集团旗下智能院联合恺望数据,吸引包括主机厂、自动驾驶算法公司、芯片厂商、Tier1供应商、传感器厂商等产业链关键环节,超50家企业加入生态圈,有效解决数据鲜度不足、规模不够大、获取成本居高不下等瓶颈问题。这一颠覆式创新模式,为破解全球自动驾驶行业数据困局提供了行之有效的“北京方案”。
单车采集VS众源汇聚
数据是AI系统落地效果的关键因素,依靠传统单车采集数据,维度、规模、质量难以匹配需求,且无法穷尽所有复杂场景。北京通过众源汇聚模式,依托路侧智能化设备采集、生态企业合作共享,汇聚形成全场景、全天候、全链条、全要素的众源共享数据空间,打破数据需求激增与采集手段单一的局限。依托北京高级别自动驾驶示范区,目前已积累7PB双智城市路侧数据、1200余台车辆超4000万公里自动驾驶测试数据、双智城市135万件城市家具实时数据、1000clips智驾方案商数据、40家国内外知名主机厂及零部件企业产业链数据集、超3000小时智能驾舱语音交互高质量数据集,实现高质量数据服务高效率、低成本、一站式获取。
自采自标VS数据拼车
依靠传统的企业自建自用模式,企业需投入大量成本获取数据,并进行预处理、标注等加工程序,导致数据获取成本高,加工效率低,且不同企业重复投入,造成成本浪费。北京创新自动驾驶“数据拼车”模式,提取11V、BEV、行车、泊车、高频高危等产业生态共性需求,通过众源汇聚车端数据实现供需高效匹配,让车企像拼网约车一样共享应用数据。企业无需对已有的基础成品数据重复高成本投入,通过“数据拼车”后仅需简单二次加工即可快速满足用户定制化需求,实现以团购的价格享受定制化服务,用传统自采集三分之一的成本获取算法升级迭代亟需的高质量数据。同时,通过对北京高级别自动驾驶示范区海量路侧感知数据进行高精矢量级标注,满足同路段不同车企车端数据的来料映射加工需求,实现路侧数据一次标注,多场景、多车型复用,形成路侧数据标注车端共享服务模式,让企业仅需传统模式十分之一的成本即可获取数据服务,切实实现降本增效。通过数据拼车模式,北京人工智能数据训练基地已经形成了4D BEV车道线、OD数据等一系列高质量数据集,助力智驾算法从高精地图向无图驾驶演进。
企业自用VS共享共用
由于智能网联数据往往涉及地理位置等敏感信息,企业出于合规顾虑不敢共享。同时,企业模型性能提升的市场竞争激烈,共享数据的意愿不强,且数据的供方、需方难以精准高效匹配,导致大量数据在企业沉淀沉睡,价值没有被充分挖掘。智能院全国首创人工智能数据沙盒,通过严谨规范的工作流程、权威专业的合规评估、多元合一的风险补偿,为敏感数据合规应用提供“避风港”、为企业供数用数提供 “定心丸”、为数据产品流通利用提供 “通行证”。同时,依托北京人工智能数据应用开发平台、公共智算中心、人工智能数据训练基地,打造“安全可信、客观中立、存算一体、软硬结合”的基础设施,为数据价值精准挖掘、高效标注加工、可信算法训练提供“数算模用”一体化公共服务,打破企业之间的信任藩篱。
目前,自动驾驶“数据拼车”众源共享新范式已实现政策、平台、设施、技术、商业的闭环。新范式的落地,将有力推动技术创新与商业化进程,为我国乃至全球的自动驾驶产业高质量发展注入强劲动力。未来,北京将持续深化推广应用,汇聚更多生态伙伴,不断充实“数据粮仓”,共享数据红利,共同描绘双智城市时代新篇!