来源:36氪
在媒体的渲染下,人工智能似乎无所不能,将要取代很多人干的事情,比如开车。但几年前科技公司预言的无人车即将遍布大街小巷的场景并没有到来。人工智能的“智能”似乎出现了瓶颈,总是要靠“人工”去慢慢提升——比方说,当机器无法识别某个对象时,就需要人工将该对象标识出来,这就是给数据打标签。人工智能的训练催生了人工打标签众包业的崛起,Vittoria Elliott聚焦了这个行业背后的现实,原文发表在Rest Of World上,标题是:Training self-driving cars for $1 an hour
划重点:
训练人工智能需要大量廉价劳动力,这些劳动力大都来自亚非拉
迄今为止无人车技术最大的贡献在于意外地帮助创造了一个庞大的劳动力资源池
对于众包工人来说这个行当并不好挣钱,逐底竞争会导致他们的收入慢慢减少
四年多来,Ramses每天在委内瑞拉巴基西梅托的家中醒来后,都要打开电脑,开始给图片打标签,此举可以帮助无人车有朝一日无处不在。他的操作要通过一个叫做Remotasks的微任务平台,去识别街道两旁随处可见的普通物体——树木、灯柱、行人、停车标志——从而让自动驾驶 也可以学会注意到这些物体。
跟众多的委内瑞拉人一样,当国家陷入经济动荡时,Ramses也开始把目光转向微任务。这份零工让他有机会赚到美元,而不是本国货币,因为本国货币容易受到极高的通货膨胀的影响。出于隐私的原因,Ramses要求只能用本人的名,他说:“我一周7天都在工作,从不休息,但每周工作7 天,每天工作12 小时,能让我赚不少钱。”
在全球各地像Ramses这样的人(其中很多都是在南半球)不在少数,他们已经成为训练自动驾驶 的新劳动力的一部分。这些工人遍布从肯尼亚到菲律宾的各个地方,在科技行业最突出的板块之一中发挥着至关重要但鲜为人知的作用。
2010 年代初,大概在委内瑞拉经济开始崩溃的同时,各家公司开始往自动驾驶 投入巨资。到 2015 年时,谷歌的母公司在自动驾驶 项目的研发上的花费已经超过 10 亿美元。布鲁金斯学会 2017 年发布的一份报告估计,科技公司和 制造商在该技术上的投资已超过 800 亿美元,所有这些努力都是为了让自己能站上当时被认为是人工智能的“前沿”。很多公司向投资者和消费者承诺,无人驾驶 将在几年之内普及。
自动驾驶 依靠摄像机、雷达传感器、激光雷达传感器、GPS 天线和其他工具来读取路标,并不断地绘制周围环境的地图。为了让自己的表现能像人类驾驶员一样出色, 必须快速处理和响应不断变化的信息流。一条迷路的小狗、突然下起的阵雨,或一个坏掉的交通灯都可以让无人驾驶出问题。为了应对这些以及数百万种其他的可能性,为自动驾驶 提供动力的复杂软件和算法需要大量高度准确的数据——以及一大群人来提供这些数据。
随着开发自动驾驶 的竞争愈演愈烈,那些公司突然发现自己需要人工来构建训练数据集。这些数据集通常由自动驾驶 在试驾过程中捕捉到的数十万张图像和视频构成。而那些工人的任务是给里面的对象打标签,从而让机器学习算法可以慢慢学会区分树木和停车标志。为了完成所有这些繁琐的工作,许多公司都把目光转向全世界的众包行业,这个行业会组织大家做一些零散的任务,比如对餐厅点评进行评估或回答调查问题,从而在网上赚钱。
弗洛里安·亚历山大·施密特(Florian Alexander Schmidt)是德国德累斯顿应用科学大学的教授,从事微任务行业和自动驾驶 训练的研究,他说:“我认为, 行业资金的涌入实际上已经极大地改变了众包行业。” 以在过去,外包公司主要靠提供大量工人,从而批量、快速、低成本地完成大量调查或工作。问题是得到的结果不一定非常准确。施密特解释说:“很多 [数据] 都是垃圾。这在自动驾驶 领域是不可接受的。”
施密特说,在过去几年的时间里,很多微任务和第三方外包公司改变了自己的运营方式。首先,这些公司引入了质量控制措施,以确保自动驾驶 业客户的工作几乎不会出错。现在不仅有工人在做实际的贴标签工作,还有其他工人进行训练以及对已完成的任务进行检查和纠正。
这些公司还拉开客户跟工人之间的距离,他们往往没法向公司提供反馈,甚至就分配给他们的任务提出问题都不行。据我们交流过的九名工人说,客户通常会就要完成的每种工作给出详细的指令,但跟他们几乎没有直接的互动。在某些情况下,公司会派出代表亲自培训特定的接单人,然后再由后者去教同行并复核他们的工作。
在疫情之前,菲律宾的行政和金融专业人士Marissa Zuniga作为一名海外菲律宾工人 (OFW) 曾在深圳生活了近 20 年,然后把挣到的钱寄回给自己在奎松市的家人。跟许多在中国打工的菲律宾人一样,2020 年初中国农历新年假期的时候她也趁机回家了。但不久之后,随着疫情的发展,两国都开始限制旅行。Zuniga被困在了菲律宾,失去了原先的工作。
她很快就通过Facebook上面的广告发现了Remotasks,现在她每天的工作就是检查平台上其他接单人的工作,确保其近可能的接近完美。Zuniga 说:“我现在的项目是确保给 在路上能看到的所有东西都着上色。你得标注一切。这件事情的规模非常庞大。”
跟平台的很多其他工人一样,Zuniga 每完成一项任务就会获得报酬。可能需要三四天时间才能完成的一项艰巨工作能让她赚到 20 到 30 美元。当自己最终能返回深圳时,Zuniga说她希望能继续从事微任务工作来增加收入。她说:“如果按每小时算的话,这份工作挣不了多少钱。但我很享受现在所做的工作。”
而Ramses这边在几个月前最终决定停掉Remotasks平台的工作,因为委内瑞拉的工资标准下降了。他说:“刚开始的时候,我每周可以赚 200 美元。但随后费率下降了。有时候我一周只能挣20 美元或 30 美元。” 他最终决定离开这个国家,到别处寻找工作。
Remotasks由总部位于旧金山的初创公司 Scale AI 所有。这家公司最近的估值已经超过 70 亿美元,从投资者处筹集到的融资超过了 6 亿美元。在一份声明中,该公司的一位发言人表示,“工资标准可能会随着时间的推移而变化,因为这要取决于地点、时间和指定项目的复杂性等因素。”
多伦多大学研究人工智能与拉丁美洲外包行业的研究员Julian Posada表示,他的研究发现,零工的总体收入正在减少。他说:“当这些(众包)平台刚开始进入市场时,他们要招募人员。但现在打零工的数量已经到达了临界点,于是平台开始降低工资标准。”
微任务众包公司并不是唯一从自动驾驶 热潮中获利的。2019 年,在生完孩子后, Joy Olwande 希望重返肯尼亚的劳动力市场。她看到了CloudFactory(在内罗毕设有办事处的业务流程外包公司)正在为多个人工智能项目招聘员工。六个月来,Olwande每天都要工作两个班次,每次四小时,中间有休息时间。在其中一个班次上,她要为自动驾驶 的激光雷达图像——高分辨率图片——做标注。
但跟 Zuniga 与 Ramses不一样的是,Olwande是跟数百名其他员工一起在现场工作的。她的时薪约为 1 美元,而且跟那些在微任务网站上工作的人一样,需要保持高度的准确性。她说:“当我的准确率掉到 88% 时,我曾经收到过一次警告。”虽然Olwande很喜欢这份工作以及自己的同事,但半年后她还是离开了,去找了一份通勤时间更短、薪水更高的工作。
在标签的类别里面,有一个类别叫做“大气”,工人要为每一滴水都打上标签,这样 就不会将水滴误认为是障碍物。
虽然外包行业可能仍在蓬勃发展,但自动驾驶 公司所承诺的未来——街上将被自动驾驶 塞满——尚未到来。今年 5 月,《纽约时报》曾报道称, 仍然无法应对驾驶时可能遭遇的众多场景。道路外倾或雾气之类的东西对人类来说也许司空见惯,但机器依然感到困惑。完善这项技术可能需要数十亿美元的研发投入。与此同时,不断变化的挑战在工人要执行的任务中也得到了体现。
之前在CloudFactory内罗毕分部干过,现为Remotasks员工的Timm Ndirangu Gachanja说,他注意到上面要求他和他的同事要识别的东西已经改变。他说:“你会发现他们正在引入其他的新标签。比方说,如果下毛毛雨的话,现在所有的摄像头都已经很强大了,可以捕捉到大气里面最微小的水滴。”在标签的类别里面,有一个类别叫做“大气”,工人要为每一滴水都打上标签,这样 就不会将水滴误认为是障碍物。
施密特表示,到目前为止,最重要的创新不是自动驾驶 本身,而是这个行业意外地帮助创造了一个庞大的劳动力资源池。受采访的部分工人表示,他们还为医疗技术、智能家居设备甚至垃圾分类训练人工智能。
施密特说,现在,第三方承包商和微任务平台正在想办法将任务分解成更小的块,或者让人们在手机上就能完成。这会有助于为更多的工人提供就业机会。施密特说:“想想看,未来几年较贫穷的国家会有多少人能用上不错的互联网。对于这个全球性的劳动力供应链来说,这确实是一个庞大的劳动力资源。”