6月20日,在华为开发者大会2025(HDC 2025)上,全新发布基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代。
在火星探测领域,盘古世界模型能够基于单张火星地表图片,生成高精度的数字物理空间。借助这一技术,火星车可以模拟真实任务场景,通过分析环境中的距离和角度信息,预判可能的物理碰撞并训练避障能力;同时,通过对数字空间中岩石的抓取模拟,还能提升机械臂的操作能力。
在智能驾驶领域,输入首帧的行车场景、行车控制信息和路网数据,盘古世界模型就可以生成每路摄像头的行车视频和激光雷达的点云,能够为智能驾驶生成大量的训练数据,而无需依赖高成本的路采。广汽集团与华为云 合作,依托盘古多模态大模型,实现了2D视频模态与3D点云模态的像素级对应,在数分钟内即可完成复杂场景Corner case的复原,为端到端模型“两天一个版本”的高效迭代提供了强力支撑。
盘古世界模型的发布,有助于进一步推动数字世界与物理世界 融合,加速人工智能技术在更多复杂场景中落地应用,为人们探索未知领域和构建智能社会创造更多可能。