天才人工智能也学习 光鲜智能背后由人工撑伞家电
2016年,谷歌旗下的人工智能公司DeepMind研发了一个能够读懂唇语的人工智能系统。让AI系统学习了5000个小时的BBC新闻节目后, 其准确率攀升至46.8%,秒杀唇读专家的12.4%。同样的情形还发生在围棋冠军李世石与阿尔法狗身上。AI 学习之所以能取得巨大成功,一个重要因素是其背后起着绝对支撑作用的人工标注数据,这些数据由大量的人工从众多数据样本中搜集、清理、标注和分类加工而来。隐藏在人工智能背后的并不只是衣着光鲜的技术,而是代价极高的人工标注。目前AI尚未摆脱对大规模数据和样本必须先由人工标注方可学习的依赖。
目前的人工智能,由两个部分组成:“智能”和“人工”。也即现阶段的人工智能仍未达到完全智能的境界,而是仍然处于 学习的过程。在这个背负着世界上最先进的科技代名词的背后,矗立的是一个庞大由人类构成的群体,他们不是人工智能公司的科学家和工程师,而是数据标注团队。
据HEA了解,数据加工公司的工作人员会手动为图片、视频和语音内容打标签、做标记。标注好的数据会被人工智能公司用来训练算法模型,然后应用到图像识别、语音识别等不同领域。如在图片中标注所有人眼可见元素,包括人物、动植物、景色、物体、类别等,这便是图像识别技术运用的初始模样。
经常与图像识别打交道的人工智能领域研究者们,大多都使用过数据庞大且对外开源的数据集ImageNet,包括此前从百度离职的吴恩达。ImageNet中拥有1500万张标注图片,据了解,这些图片是由全球167个国家的近50000名工作者花费2年的时间,对近10亿张通过互联网搜集到的图片进行分类和标注,才造就而成的。有数据标准公司员工向家电网称,一个标注员一天标准10张图片已经很不错。
值得一提的是,2月26日,谷歌宣布开放了一个基于 Youtube 视频的图像数据集 Youtube-BoundingBoxes Dataset,为所有研究者进行模型训练和研究提供了新资源。谷歌宣称这个数据集的检测数量(detection count)为ImageNet的五倍。这个数据集包含1050 万人工标注的帧,500 万边界框,从 24 万个截取的视频中标记了38 万条 15-20 秒钟长度的视频片段。
如今在众多科技公司背后,都会有数据标注公司的身影,他们负责对图像、视频、语音、文本等数据进行清晰、评估、提取以及标注,而同一张照片或者同一个视频,每一家人工智能公司所需要的数据内容需求和用途大不相同,用来训练人工智能学习能力的类别也不同,因此同一张照片可能会有多种标注。
人工智能所依靠的是大数据,大数据却是由众多数据加工公司手动处理过的结构化数据构成。大数据支撑着人工智能系统,数据公司支撑着大数据的结构化,数据标注员支撑着数据的准确性和高质量。在公众眼中,看到的是家电厂商展现在客厅里的智能识别技术,实际上对团队而言,是日夜颠倒、枯燥乏味的一张一张图片的耐心标注。
有IT数据公司的员工表示,标注数据和富士康的流水线没有多大区别,属于不断重复着同一个动作同一件事情,都处在价值链的底端。当外界赞叹人工智能改变了大众生活的方方面面、让生活变得更加美好的同时,是由众多的数据标注员们的耐心和专注搭建而成。人工智能的火热带动了大量的数据加工初创公司的涌现,而这些将人工智能推向科技顶端的标注员并未因此站在科技顶端。
据了解,微软亚洲研究院的研究人员们于去年提出了一种全新的人工智能 学习范式——对偶学习。对偶学习可以将未标注的数据用起来,从而降低对人工标注大量数据的已有学习范式的依赖。
作者:HEA.CN 来源:家电网
1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。