揭秘Google地图背后的秘密:隐藏的算法与人工操作评测
导航在近几十年经历了翻天覆地的变化。上世纪90年代,我们要在箱内塞满纸制地图,后来可以从Mapquest地图查询网站打印地图,而现在可以无脑地听从Siri或Google地图的指示。但这些指令背后,包含了你想不到的大量数据。
寻找“地面真相”
在加州,Google地图团队通过算法与细致手工作业相结合的方式,改善地图,这项工作被称为“地面真相(Ground Truth)”。该项目于2008年启动,但到几年前都处于保密状态,并一直持续发展,现已覆盖了51个国家。而算法在从卫星、航拍以及街景图像中提取信息上,扮演了更为重要的角色。
街景项目在2007年启动,当时它能提升用户体验,通过让人们看到其目的地的周围区域帮助定位。Google地图的副总裁Brian McClendon说:“我们很快就意识到,制图的最佳方式之一就是拥有世界街道的摄影记录,然后再求助那些随时能对其纠错的人。”
随着街景项目发展,团队意识到只抽查数据是不对的。街景勘测车现已行驶了超过700万英里,包括了美国99%的公共道路。Google地图的产品经理Manik Gupta说:“这实际上允许我们用算法,从提取信息中构建新数据层。”这些算法从计算机视觉和机器学习等领域借鉴方法,进而从街道编号、商户名称、交通标志、限速标识以及其他兴趣点上提取特征。
McClendon说:“停车标志无关紧要,它们只是做得显眼而已。通路标志提取起来更困难,因为它们并不一致,但我们现在对此变得聪明多了。”转弯限制标志对导航可谓重中之重,但通过算法捕捉则显得很棘手。有时指示箭头喷涂在路面上,有时它们则在头顶上,颜色和尺寸各有不同。
路标也很重要。如果司机从导航仪听到的内容能与看到的路口相匹配,那么他们就能更容易地跟随语音指示,但有时用在路标上的拼写和缩写却各有不同。McClendon说:“匹配标识上所写的东西实际上是一项困难且重要的问题。”
其他算法从卫星和航拍图像中提取建筑物的占地面积和高度,多数美国建筑物现已出现在Google地图上,对于地标,计算机视觉技术会对其提取细致的3D模型。Google曾表示,它们收购高分辨率卫星图像公司Skybox,至少在最初是为了提高地图的准确性。
地图背后的人工团队
卫星和算法只能让你得到迄今为止的数据,Google雇佣了一个人类操作员小队使用一种叫做“Atlas”的内部程序来手工检查和纠正地图。Google方面并未透露小队的具体人数,而公司外部也只有很少人见过该程序被投入使用。Nick Volmar是地图团队中最富创造力的操作员之一,他演示了该系统。
操作员所看到的看起来很像是Google地图的混合卫星地图,但上面的颜色线和符号则不常见。道路会根据行进方向以不同颜色标记,红绿箭头则指明了某个既定交叉路口可能要转弯。Volmar熟练地点击屏幕一侧的方框,切换开关各种图层,街景图像中捕捉的交通标识就会出现或消失。
Volmar展示了如何通过点击与拖拽卫星图像的方式,修复一条失准道路。这看起来容易,甚至也许挺有意思,并且与编辑“开放街道地图”的过程并无不同。但Volmar与其他操作员不仅每天要检查数以万计用户上报的问题,并且还要根据需要修复它们。
一张地图就展示了旧金山某条高速公路的道路优化情况,线宽即代表了交通流量。Google数年来一直在使用手机位置信号勘测交通状况,Gupta也承认它还可以成为其他信息的良好资源,比如转弯限制或单行道,但他拒绝对此详细说明。Gupta说:“Google以多种方式使用定位,但除此之外,我能说的也没有什么特别的。”
除了Volmar这种的操作员,Google还通过其“MapMaker”项目从平民那里得到制图帮助。该项目于2011年启动,现已在超过220个国家运作,目标是为发展中国家以及其他无法使用准确地图源的地区改善Google地图,Gupta表示:“我们招募用户添加对他们来说重要的制图信息,我们提供工具以及卫星图像,他们可以进行纠正。”
在离家更近的地方,人们可以贡献公园、小路、以及其他街景勘测车无法到达之处的数据。McClendon说:“我通过GPS系统记录了上山的路线,然后添加了更精确的小路数据。”
看着工作人员操作Atlas,你会有一种“深图”的感觉,当你打开Google地图时,在实际看到的图像之下还存在着更多数据,不仅是道路布局,而且还关乎互相连接的逻辑。信息不只关于建筑物的形状,地图只会变得愈加细致。
1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。