亚马逊人工智能布局背后,希望随时随地向你卖东西业界
8月8日消息,《连线》近日撰文揭秘“万货商店”亚马逊由AI驱动的宏大发展蓝图。AI助手Alexa是亚马逊成为全球第一大公司的计划至关重要的一部分,该公司想要通过用无所不在的AI替代网络商店界面,实现随时随地向顾客出售任何他们想要的东西的“随地商店”(Everywhere Store)愿景。
以下是文章主要内容:
杰夫·贝索斯(Jeff Bezos)或许是世界上最狂热的《星际迷航》(Star Trek)粉丝。当初,这位亚马逊CEO兼创始人一度想要将他的电商平台命名为makeitso.com,致敬口头禅是“make it so”的尚-卢克·皮卡德舰长(Captain Jean-Luc Picard)。2016年,恳求派拉蒙电影公司多年以后,贝索斯得偿所愿,在《星际迷航3:超越星辰》(Star Trek Beyond)中客串扮演一个外星人。当亚马逊着手要打造AI助手Alexa的时候,贝索斯设想着终于要让《星际迷航》计算机变成现实——一个亲切的,无所不知且无所不在的助手。
“我们确实把Alexa想作《星际迷航》计算机,在该电影中,它就在你周围,你只需要说声:‘Computer, beam me up。’(计算机,把我传走。)”亚马逊Echo、Alexa和Appstore副总裁迈克·乔治(Mike George)表示。
我在位于西雅图市中心丹尼三角街区的亚马逊摩天大楼Day 1高层会见了他和Alexa高层团队的大多数成员。在那里,在一个天气晴朗的早上,太空针塔(Space Needle)因附近积雪盖顶的山脉而显得很渺小。二者似乎是底下的亚马逊帝国无关紧要的存在。站在那里,组成该公司基础的30座大楼清晰可见,就在联合湖周围。150多米以下是一个地洞,该公司在兴建更多的大楼。处在高楼之间的、正在建设的两座30米高的大楼将会容纳300种植物种,为亚马逊员工提供又一个办公空间。该公司获准打造高达920万平方米的办公空间,这足够它将员工规模扩大一倍。该园区可谓亚马逊世界的一个缩影:总是展望未来,扩张迅速,让人难以跟上它的步伐。
今年4月,亚马逊市值达到4398亿美元,为全球第四大公司,仅次于苹果、Alphabet和微软。贝索斯的在线商店从出售图书起家,如今已经将触角伸向诸多的领域。亚马逊Prime——包括快速配送等服务的会员服务——在英国拥有数百万的订户,在美国拥有数千万的订户(亚马逊拒绝透露具体的数据。)亚马逊网络服务(AWS)是它的云计算平台,为包括Netflix和Spotify在内的诸多网站提供服务,其年收入规模已经达到120亿美元。2月,亚马逊制作室赢得了自己的头三项奥斯卡奖项。该公司正在美国开设实体店,在租赁40架货运飞机,且已经成立了一个出版部门。它的网上服务型市场Mechanical Turk有数十万的固定贡献者。该公司正在英国剑桥测试30分钟送达的Prime Air无人机送货服务,它还计划在当地为它的机器学习研发中心增招400名员工。6月,它斥资137亿美元收购有400多家门店的全食超市(Whole Foods)。
AI“黄金时代”
AI长期以来一直是亚马逊业务的核心所在。“我们从机器学习技术获得的价值实际上有很多是看不见的。”贝索斯5月在互联网协会的年度活动上表示,“这些价值包括搜索结果的改进,产品推荐的改善,库存管理预测的改进,以及数百样其它的事情。”
随着Alexa在2014年11月的推出,亚马逊进入了贝索斯所说的AI“黄金时代”。Alexa是亚马逊AI项目的门面,是将会帮助消费者穿梭于亚马逊帝国和在亚马逊上消费的促进器。亚马逊是一个从出售图书起家,如今出售自有的音乐、电影、硬件以及日常用品和食品杂货的帝国。亚马逊已经成长成为庞然巨兽。通过将旗下平台开放给第三方的开发者和品牌商,亚马逊想要让Alexa渗透到你的生活的方方面面:你的家居, ,医院,工作场所。万货商店即将变得无处不在。
罗希特·普拉萨德(Rohit Prasad)处在创造某种历史的边缘。这位亚马逊首席科学家曾在BBN Technologies公司致力于研究自然语言和语音识别技术,为美国国防部高级研究计划局(DARPA)等客户提供服务。亚马逊2013年向他抛出橄榄枝,邀请他加盟打造语音控制的AI服务。这是他梦寐以求的一个机会。
“当时我两眼发亮。对于语音识别和语言技术,很长一段时间以来我们都在说,它们的终极应用是将你从眼睛和双手解放出来。”他说,“我接受了该项挑战。”
在普拉萨德到来以前,Alexa的愿景便已敲定。跟亚马逊任何的新想法一样,他们围绕Alexa起草了新闻稿,描述一款听到你叫唤名字就会唤醒的环绕设备。它的个性会反映亚马逊自己的品牌指南:聪明,谦逊,乐于助人。它还得变得像人一样,而不是像机器人。Lab126团队——亚马逊在加州设立的神秘研究部门,催生过Kindle电子阅读器、Fire TV Stick电视棒Fire Phone手机等产品——当初从那个原始文件向后进行工作。(Lab126员工称,该项目一开始是亚马逊从未证实过的、被搁置的增强现实项目的一部分。)这个时候,亚马逊收购了两家AI创业公司:来自韩国的YAP和加州的Evi。二者是Alexa语音技术的基础。但普拉萨德称,开发该产品需要攻克机器学习方面的挑战。
这部分因为贝索斯对产品要求很高。一位研究人员向彭博社表示,“对于该设备的功能,我们曾有着近乎荒谬的期望。贝索斯的设想是将它完全整合到购物体验的每一个环节。”
Echo在2014年推出市场的时候,几乎马上就赢得了消费者的青睐。截至目前,亚马逊已经共计售出数千万台支持Alexa的设备。“这是一个全然不同的全新品类。之前没有人推出过这样的产品。”乔治说。
“Echo带来了变革性的影响,让人机交互变得容易了很多。”麻省理工学院数字经济项目主任埃里克·布林约尔松(Erik Brynjolfsson)指出,“理论上,它是做了某样你原来就可以做到的事情,但它让整个体验变得非常顺畅。”
语音助手争夺战
Echo推出之时,完全没有竞争可言:谷歌的同类产品Google Home直到2016年10月才出现。被困在智能手机当中的个人助手们,比如苹果的Siri和微软的Cortana,也面临一大发展障碍:没什么人会愿意在公共场合对着AI说话。
该领域事关重大。语音助手的争夺战,称得上成为下一个无处不在的界面的争夺战。理论上,它将不仅仅取代触控屏,还将取代搜索栏。12月,苹果将开始出货它支持Siri的HomePod智能音箱。微软已经发布来自第三方的由Cortana驱动的音箱。4月自称“AI为先公司”的谷歌开放API(应用程序接口),以期加速其Google Home的增长。它正在图像识别和翻译领域取得重大的技术进展。5月,它的DeepMind项目AlphaGo击败人类世界围棋冠军。Facebook和百度也在大力投资发展AI。
不过,第一个搞懂如何吸引大众将AI带到他们的家居和生活的是亚马逊。凭借名为技能(Skills)的第三方语音应用,Alexa一下子就变得比Siri、谷歌Google Assistant实用。它的竞争对手常常会误解用户的问题,提供不当的搜索结果,而Alexa则能够提供诸多有用的服务,比如打开你的电灯、通过Uber叫车和教你说中文。Alexa支持的技能已经超过1.2万项。谷歌的AI优势——可能是亚马逊的最大威胁——在于它的搜索技术,在于其搜索引擎拥有似乎无穷无尽的知识。但Alexa还有另一项杀手锏:连接亚马逊庞大的物流和零售帝国。Google Home能够给你带来知识;Alexa能够在短短几个小时内给你送达所需的商品。如果说Google Home是派对中无所不知的朋友,那么Alexa就是体贴周到的男管家。
从一开始,亚马逊就通过指派多个分工明确的“卫星团队”来打造Alexa。他们专注于打造最佳的解决方案来将Alexa整合到亚马逊零售业务的各个环节。“我们有数千人开发Alexa,大家负责种类不同的任务,着眼于基础的科学技术。”乔治称,“我们组成这些单线程团队来打造Alexa。”
有团队在持续不断地调整Alexa的个性、语调和知识库,更好地响应用户的反馈,这一切都是为了给人以它是无所不能的真人般的助手的感觉。在亚马逊波士顿园区的分析师致力于研究与Alexa未回答的热门问题相关的内部提示。这有助于亚马逊决定给Alexa的个性带来哪些东西以及填充哪些知识缺口,进而帮助继续营造它是完全成熟的AI的印象。
Alexa很多“人类般”理解纷繁难懂的东西的能力要归功于团队严密的分析和用户反馈。亚马逊自称是世界上最以顾客为中心的公司,我采访的11位高管都在谈话中提到“贝索斯主义”。基于这种理念,Alexa团队建立框架来检测它可能会被问到的热门话题,因此它从未试过被问得措手不及。该AI懂得学习年度和季度的大事日程,因此当用户问“比分多少”的时候,它会知道他在问什么。各种新功能,比如能够根据歌词判断歌名,也指向了打造精心构造的人类般助手的理想;该功能是基于你在对话中会如何跟朋友讨论歌曲的数据。“由于Alexa是在云端打造出来的,我们能够每周给它添加新的功能。”乔治解释道。
2016年4月传奇歌手“王子”离世时,Alexa团队选择让AI对相关问题的回应变得更加敏感,因为他很受爱戴。并不是说这一原则适用于所有的名人,因此它仍然是需要团队手动引入的东西,以期避免引发令人尴尬难堪的结果。4月推出的新技能让Alexa能够低声细语,说话时懂得停顿,深呼吸,以及调整音调。同期在英国和德国上线的“speech cons”则支持以更加动人的方式加强像“yay”(哇)和“ahem”(呃哼)这样的关键字眼的语气。
开放策略
亚马逊是一家非常注重保密的公司,而它在Alexa上取得成功却是依靠开放策略:从AWS的快速扩张学到的经验。“想想我们的传统,亚马逊在全球各地提供的货品总量有近50%是得益于我们将平台开放给第三方商家的策略。”乔治表示,“对于AWS,我们一开始打造了基础性的计算服务,当时软件开发者是我们的主要客户。这有助于我们更加快速地前进,因此我们拥有这种开放历史。在思考Alexa的发展战略的时候,我们延续了这种开放思维。”
通过语音服务(Voice Services),Alexa能够出现在几乎任何的产品上。经由1亿美元的风投项目Alexa Fund,亚马逊也为初创公司提供投资,寄望于它们将来为该平台作出贡献。因此,Alexa正被整合到各种各样的东西上,从洗衣机到空气净化器,再到婴儿监控器和牙刷。“当我们将某样东西对外开放的时候,我们让人们能够与我们的产品进行竞争,我们非常乐于看到这样的情况。”乔治解释道,“我们实际上为此感到很开心,因为那将让我们变得更好,也将会把Alexa推向更多的人。”
“亚马逊在打造平台上非常精明。”布林约尔松说道,“它打造了一个更具价值的生态系统。当其它的实体将它们打造的技能放到线上的时候,亚马逊受益,消费者也受益。”亚马逊一心专注于如何加速普及技能和Alexa驱动的产品。这或许可以通过打造可WiFi锁或者新的语言功能来实现,WiFi锁可解决你每一次购买Echo时的进入凭证问题,新的语言功能则可让Alexa明白你说“给我叫辆车”时是指你想要叫辆Uber。(一开始,用户必须得说“Alexa,打开Uber技能。”)开放的策略为带来更加深入的用户案例奠定了基础。纽约计算机工程师鲍勃·帕拉迪索(Bob Paradiso)为那些具有移动问题的人打造了Echo工具。他利用Alexa设计了一个由声音控制的病床、轮椅和娱乐系统。
“有人专门为他残疾的兄弟在天花板上安置了Echo Dots。”负责开发者关系的Alexa副总裁史蒂夫·巴布钦(Steve Rabuchin)表示,“这改变了他的生活。孩子们可以通过Alexa连接他们的父母,提醒他们定时吃药。”巴布钦给西雅图见证他的双胞胎女儿出生的Evergreen Health新生儿重症监护室捐赠Echo Dots设备。这让家长可以通过Alexa询问他们的孩子的照料情况。Alexa还被帕金森症患者用来练习讲话。“大家将会借助该技术解决我们从未想到过的一些问题。”乔治补充道。
硬件项目背后的商业目的
亚马逊发展硬件的商业计划背后是它帮助你更多地花钱购物的渴望。
它推出Dash,让你只需要触碰一下按钮,就能迅速再订购日常用品。2016年11月,该公司推出仅面向Alexa的折扣优惠活动,目的就是提升语音购物的吸引力。
4月,亚马逊发布Echo Look。该产品配有一个摄像头,是第一款同时具有视觉和听觉功能的Echo。它也是一个时尚助手,你发出指令它就会给你拍照。借助Style Check技能和机器学习功能,Echo Look就能够给你的穿着品味和选择打分。更重要的是,它还能够据此提供购买建议。
几天后,该公司发布Echo Show:带有屏幕的Echo,支持视频通话。它的推广视频显示,它在帮助家长监视他们的新生婴儿的情况(以及订购尿片,收听亚马逊音乐和观看Prime电影)。Echo Show填补了Echo在功能上的一个缺陷:就一个旨在向你卖东西的系统而言,听Alexa读出商品清单上的各个选择,与它主打便利性的设计背道而驰。这也是亚马逊在接连不断地推出新产品的过程中学到的一个教训。
2016年9月,Alexa使能的家用对讲机初创公司Nucleus称,它获得了560万美元的融资,这些资金主要来自Alexa基金。在采访中对Nucleus赞不绝口的Alexa团队实际上自己也打造了一款那样的产品。它的Echo Show宣传片甚至与Nucleus最初的广告有着惊人的相似之处——另外加入了部分亚马逊零售体验。
亚马逊设备与服务高级副总裁大卫·林普
亚马逊设备与服务高级副总裁大卫·林普(David Limp)坚称,他们在发布Echo Show之前提前通知过Nucleus。“Nucleus的产品并不让人意外。”林普在Echo Show发布后称,“我仍然很喜欢Nucleus。它对Echo Show形成补充。它挂在墙上使用,它比较薄。我觉得它有着不同的用途。Nucleus和其它的公司还能够访问API,它们能够变得跟Echo Show一样出色,甚至可能更加出色。”
在Echo Show发布不久后,Nucleus创始人乔纳森·弗兰克尔(Jonathan Frankel)接受科技博客Recode采访称,“我们的产品和Echo Show的区别在于,他们想要出售更多诸如清洁剂的日常用品,而我们实际上是想要帮助家庭能够更容易地进行沟通。他们必须要认识到,试图践踏我们这一Alexa基金生态圈中的重要合作伙伴的话,意味着他们将要削弱该生态圈,给其它的公司敲响警钟。如果他们真要那么做,那说明商机肯定很大。”
Echo Show和Echo Look有着巨大的零售商机。但Nucleus一事重新提醒人们,亚马逊凭借便捷的服务赢得了人们的喜爱,但有时候它实现那种便利性的方式却令人厌恶。2015年,《纽约时报》的一篇报道描绘了该公司的员工被苛刻对待的残酷工作环境。亚马逊强烈斥责该报道,要求将其撤销。但它却支持布拉德·斯通(Brad Stone)2013年出版的公司自传《万货商店》(The Everything Store)描述类似的情节。在Lab126,Echo团队的大多数初始成员都已经不再效力亚马逊。
然而,从当日送达到低价,亚马逊顾客所享受的种种便利,显然都是这种专注和坚定不移的专心的产物。同样在《万货商店》中被曝光的“Love Memo”备忘录提供了那种专注如何体现在公司上上下下的深刻见解。该备忘录是贝索斯在亚马逊因为推出应用让大众拿线下商店的产品与亚马逊通常更便宜的线上商品比较而被诟病后草拟的。该举被指反竞争,它也促使贝索斯思考如何让像亚马逊这种体量的公司受到爱戴,而不是被惧怕。
他写下了让一家企业受到爱戴(以苹果或者迪士尼为例子)或者“不为人所爱”(比如微软或者沃尔玛)的特质清单,并将它分发给其他的高管。Love Memo与它在AI上寻求实现的东西出奇地相似:“礼貌就是酷”(Alexa一直以为都被认为很有礼貌);“年轻就是酷”(如富有争议的和Echo Look,该产品面向年轻人);“直截了当就是酷”( Alexa的回答从不拖泥带水);“意想不到就是酷”(Alexa当初是一个守得很好的秘密,它后续的产品也是如此)。
在受访期间,亚马逊的高管们普遍都对公司内部的工作惯例三缄其口,时不时会提到“贝索斯主义”和Love Memo备忘录的信条。这种一致性有时候挺讨人喜欢,有时候则使人紧张不安。没有一位高管会诟病亚马逊的竞争对手:“未来将会有多位赢家,”林普谦逊地补充道,“我非常看好Alexa将会成为其中的一位。”(“纠结于竞争对手并不酷;只给公司捕获价值并不酷。”)他们都谈到,公司在开发Alexa产品的时候表现出了快速增长的初创公司般的冒险精神。“我们有责任未来继续为顾客进行发明创造。”林普解释道。(“冒险很酷。”)
完善Alexa的个性
Alexa体验与Echo设备副总裁托妮·雷德(Toni Reid)负责领导一个由行为科学家和工程师组成的庞大团队,这些团队成员全都致力于完善Alexa的个性。他们的目标是,理解分析技术能够如何被用于改进Alexa的方方面面,从最简单的对话能力到主要的个性特征。雷德在Alexa团队成立之初时加入,当时她就认识到Alexa要变得像人类,就得变得更加讨人喜欢。
亚马逊Alexa体验与Echo 设备副总裁托妮·雷德,于1998年加盟该公司
“当我的家人坐在车里的时候,我们都会不自觉地试图使用Alexa,但她并不在。很显然她不在车里。”雷德说道。他们也希望使得所有的用户都会产生这样的感觉。“Alexa在你需要的时候就应当出现,在你没有使用它的时候就应当消失。”
Alexa越能感同身受,跟它相处就会越轻松。“情感是极其棘手的一个问题。”普拉萨德指出,“你需要非常了解别人。”如果说有哪家公司能够做到那一点,那就是亚马逊:它知道你穿什么,读什么书,看什么电视电影,听什么歌曲,等等。Alexa也许还不认识你,但亚马逊对你的了解要胜过你大多数的密友。
2016年9月,亚马逊面向大学生举办Alexa Prize挑战赛,比赛内容是打造一个能够对话20分钟的社交聊天机器人。有14个团队竞争33.8万英镑的奖金。他们需要使得AI变得更像人类,确保它能够进行令人愉快的对话。试想一下,你第一次跟某人见面,必须要跟他进行20分钟长的对话——这很难。”普拉萨德说,“你会见的人必须要很有趣,知识渊博,富有同理心,在响应你所有的情感线索方面比较感性。那是非常困难的,这不只体现在口头语言理解方面,还体现在词汇知识上。你要如何响应非言语线索呢?对我来说那是终极的AI。那是下一步。”
普拉萨德非常看好那种设想会成为现实,他已经在思考是否需要实施制衡来防止Alexa变得过于像人类。4月,亚马逊为它推出了一项工具来用哔哔声消除脏话,巧妙地提醒人们它是机器。
Alexa变得像人类也是有原因的:信任。如果说它的终极目标是变得无处不在,那它必须要赢得用户足够的信任才能够进入他们的生活。
目前,Alexa能够尝试仅凭言语来表现出同理心。它有潜力领会来自摄像头的视觉线索——如果公众信任它让它拍摄的话。推出Echo Look,意味着亚马逊通过将摄像头带到人们家中,而向那一目标迈出了第一步。“我们想要妥当行事——你不想要看到的是Alexa误读情感线索,做出某种愚蠢的事情。”普拉萨德称。
“那是行业未来的前进方向。”Evi创始人威廉·塔恩斯塔尔-佩多埃(William Tunstall-Pedoe)表示,“语音助手获得的信息越多,它就会变得越出色。在某种情况下,它将会同时接收视觉线索和其它的线索。摄像头处于开启状态,将会引发隐私担忧。但AI将会取得巨大的进步, 社交网络将能够搞清楚照片中的内容。”Alexa会记录人们的每一次说话;人们可以删除那些记录。
如果AI能够察觉有人在看着它,或者对着它的方向说话,那出于安全考虑(亚马逊称如没有被呼唤,Alexa是不会将数据发送到云端的)所使用的唤醒指令可能会消失,联网家居的最后一个痛点就此瓦解。
隐私保护与信任
亚马逊一直以来都在强调用户隐私保护之于公司的重要性。但当AI变得无处不在的时候,保护用户隐私就没那么容易了。在今年发生于阿肯色州的一起谋杀案件中,该公司拒绝交出一人的Echo语音数据——直至法官依法勒令它那么做。正因为此,Alexa有唤醒指令,Alexa激活的时候会发出光芒和声音,Echo上设置了静音按钮。“静音按钮会关闭麦克风和摄像头。”林普说道,“如果你将Echo放进衣柜,并按下静音按钮,那没有黑客会能够开启它的摄像头。那是不可能的。”
信任一直以来都对亚马逊的增长至关重要。在《万货商店》一书中,亚马逊前总编辑苏珊·本森(Susan Benson)称,在“创造良好的购物体验,以及让人们觉得屏幕另一端的人可信任上,”社论很快就变得很重要。“我们要求人们将信用卡信息保存到电脑上,这在当时来说是很激进的主意。”而现在,情况却出现反转:顾客必须要信任Alexa,相信产品另一端没有人在监视他们。
Alexa成为《星际迷航》计算机的愿景——亚马逊的高管们反复提及——充满怀旧的味道。但它也有它的逻辑依据:它不是《机械姬》(Ex Machina)或者《她》(Her)中具有威胁性的AI,而是一个乐观的愿景。这种关联可给Alexa带来社会认同,进而帮助它实现那种跃进。亚马逊在AI助手的争夺战中押下重注,谷歌、苹果和微软亦然。不久之后,不管在 里,还是在办公室或者酒店(Alexa已经被部署在温尼拉斯维加斯酒店所有的4748间房间里),你都不会缺少Alexa,因为你将永远离不开它。随着它的不断普及,机器学习也将不断改善它——让它变得更加强大,变得更像人类。也许,当它的声音变得无处不在的时候,隐私保护就会成为一大麻烦。生活将会变得很轻松,很便利。在这一切的底下,亚马逊将会为你提供各种各样的商品和娱乐内容。不管你想要什么,Alexa都会一一满足。
1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。