我个人一直把 AI 炒作当成休闲娱乐的好素材
一台机器人不可能自己学习如何玩层层叠游戏。首先承认,我没读推文链接中的文章,但毫无疑问的是,有一帮家伙打算让一台机器人学会玩层层叠。人类,付出了巨大的努力,构建起一套复杂的系统,使得机器人能够利用某种数据进行自主学习。这些数据一般来自人类的亲身试验,或者由人类通过适当设置进行强化,从而确保机器人能够在“自己玩”的过程中掌握其中的诀窍。换言之,这一切,都需要人类的参与。
同样的,到 2020 年, 也不可能全面实现无人驾驶,语音识别也无法接近人类的水平。“Alexa”根本不能作为真正的交谈对象,计算机视觉无法回答一切视觉问题,我们也没必要担心机器人产生自我意识并到处追杀人类。
有些人意识到了在热火朝天的 AI 发展背后,种种乐观甚至公正的预测都没能及时成为实现,这也导致了“AI 寒冬”理论的出现。但实际情况恐怕也不会朝这个方向前进。AI 寒冬说的来源,在于 AI 领域存在着太过夸张的炒作与期望,而其发展潜力却并没那么可观。现在,是时候来一波拨乱反正了。人们把 Alexa 视为一种会话代理,但它在本质上就是一款更先进的麦克风,是一套基于规则但设计目的更为广泛的系统,并由深层神经网络提供更好的语音识别效果。《连线》在文章中将 学习描述为贪婪、脆弱、不透明且浅薄的事物——这些说法都是对的,但即使存在种种限制,其仍然能够完成很多很多重要的工作。
所谓实用性 AI,更多关注我们应该如何总结问题以及能够收集哪些数据,而非强调那些花哨夺目的新模型。这里得多提一句,当下人们对于新模型有点关注过度,甚至把它捧得与久经考验的网络、系统以及数据库一样高。事实上,它就是一种新算法,而且最终需要归于人类。
人类的表现,就是超级 AI 的效能基准(报道中就总会说某些方法已经能够在某些具体问题上达到人类的水平)。然而,人类真正关注的内容,却往往被这些超级 AI 所忽视。但没关系,随着 AI 成果在迈向实际应用的过程中不断受矬,研究人员们最终会重拾这些关注核心,并将其作为新的探索前沿。而只要能够从这个角度思考问题,炒作之声也将自然消散。毕竟无人驾驶 目前只能在拥有良好照明条件的主干道路上行驶,而人类司机则能够寻找乘客、给车辆加油、动手处理一些小的机械故障、确保醉酒的乘客安全抵达以及将身体不适的老年乘客及时送往医院等等。
我们开始逐渐摆脱大肆宣传 AI 能够重现人类表现的阶段,继而转向更实用主义、也更加以人为本的机器学习应用道路。如果说炒作的外露冰山正在快速融化,那么伟大的以人为本应用理念就是支撑这一切的水下基座。
统计模式识别与人类非确定性
几天之前,我曾在推特上提到,如果我们不再使用“AI”这种表述,而是使用更具体更准确的“统计模式识别”这一术语,那么炒作问题是否能够随之消散。
其他人对此有着不同的见解——Judea Pearl 认为我们需要新的方法实现因果推理,Pedro Domingos 致力于寻找“主算法”,也有不少人希望实现“与动物能力相仿的认知功能优化”并逐步推进至人类智能重现。
无论这一切要如何实现,相关讨论都客观存在,因为“AI”这个词本身就传达出一种智能概念——而当前的方法,显然无法实现与人类相当的智能水平。我们的系统缺乏常识,无法跨领域进行类比、推理因果关系,也不具备与充满非确定性的人类进行交互时所必需的其它智能要素 [1]。
但我们必须承认,单是统计模式识别就堪称一种极为强大的工具。要想充分加以利用,我们需要努力找到那些特别典型而且特别重要的问题,以确保 SPR 能够良好运作。立足于现有人机交互及其固有方法的起效方式,我们的实现思路可以总结为:发现重要问题 ->将其映射为计算机易于处理的解决方案 ->收集有意义的数据集 ->设计出对人类有意义的交互方式。
人机交互(以及人类在 AI 当中训练产生的人机交互方法)的存在,正是我认为 AI 不会进入寒冬,而只会走向秋季的原因所在。能够运用 ML 解决真实人类问题的从业者,将成为下一阶段中最为关键的技术力量。随着各类易于使用的算法库的出现,功能强大的 ML 将逐步实现民主化普及;如果大家希望保持依靠地位,那么必须得掌握与人机交互相关的各项技能。
如果你的目标在于顺利度过寒冬,并希望有朝一日能够开发出真正具有智能的 AI 方案,那么请摆脱 学习与实际应用的束缚,勇敢探索更为远大的目标。
但如果你的目标是获得看得见、摸得着的回报,那么人机交互将是后续研究当中无法回避的核心。
人机交互,收获 AI 果实的工具
人机交互的力量源自多个学科——其中至少包括计算机科学、设计以及行为科学(心理学、认知科学等)。熟练掌握人机交互的从业者,能够通过各种以人为本的方法理解现有方案,设计并实现未来方案,同时对其加以验证。与大多数研究领域一样,一部分从业者可能专注于研究用户对于当前技术的使用方式,也有些人会专门负责设计可能具有发展前景的未来方案,或者构建出未来技术系统的原型框架以供人们体验。
以下,是我认为人机交互(及其相关领域)研究与实践方法中,有望真正收获到 AI 果实的部分领域。而且无论未来几十年中真正的智能机器能够取得怎样的发展,这些领域都将长期拥有非常重要的学科地位:
用于支持人类的智能应用
随着机器学习方法的理解门槛不断下降,并被更好地整合至现成工具当中,最大的挑战将转变为如何利用它们解决真正的人类问题。而这,正是人机交互最擅长的方向所在!
正如 Vannevar Bush 在《As We May Think》(https://www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881/)中所提到,在发展初期,智能机器的重点在于智能增强(简称 IA)。虽然我们将 Douglas Engelbart 视为鼠标之父,但他实际上将主要精力投入到了“一切演示之母”项目当中,即探索如何利用计算技术以普遍方式增强人类智能。曾有一段时间,这方面议题被称为“智能用户界面”,并被直接作为一大重要相关会议的名称。如今,随着 AI 技术局限性(以及 AGI,即人工通用智能,几成发展死胡同)的坐实,“人类增强”概念正在重新流行起来。由于其中诸多见解至今仍然具有深刻的现实意义,我们仍然有必要认真拜读技术先驱者留下的宝贵思想。
人机交互的当前任务,在于找出那些能够帮助人类解决的重要难题——即收集并扩展新的数据集,找到能够实现人类与机器间协作的新方式,发明出能使设备与人类世界更易于访问的新系统,创造出 ML 支持型传感繁育,将成果应用于交互与健康领域,并致力于帮助人们更好地构建 ML 模型等。
这一领域中的种种挑战与影响,反映出的是这样一项基本事实——最重要的是创造并解决新问题,而非改进现有解决方案。因此,我们需要遵循发现并验证问题,不断提出潜在的解决方案与原型设计并加以改进,最终验证解决方案是否能够实际解决预期问题这一完整的基本流程。
随着机器学习算法的商品化,那些能够立足整体机器学习应用场景统筹全局的人才,将成为新时代下的 VIP。
设计与 AI
长期以来,人机交互工作者一直在考量人类应该如何与 AI 实现相互作用,以及如何开展工作以切实达成这种作用。早在上世纪九十年代,Pattie Maes 与人机交互先驱 Ben Schneiderman 就曾在“代理与直接操纵”(https://www.lri.fr/~mbl/ENS/FONDIHM/2013/papers/ShneidermanMaes-Interactions97.pdf)这场经典的辩论当中体现出这样的思维。Ben 后来又发现,信息可视化探索实际上是一种方法论反应,其希望解决的是人类如何直接与日益丰富、日益复杂的数据世界进行交互这个问题。
很久之前,同时涉及 AI 与人机交互领域的从业者们就已经意识到,构建包含“AI”元素的用户界面时,其基本思路应该有所不同;这主要是因为 AI 往往存在不确定性,且正确率往往有待商榷。Eric Horvitz 和其他一些研究者将此称为“混合主动交互”。大家可以在这篇 经典论文(CHI 1999 http://erichorvitz.com/chi99horvitz.pdf)当中读到相关论点,此外我还推荐大家参考由 AI 大师 James Allen(会话交互)发表的另一篇文章(https://www.microsoft.com/en-us/research/wp-content/uploads/2016/11/mixedinit.pdf)。Eric 曾与 Saleema Amershi 等其他作者在他们的 CHI 2019 论文《人类 -AI 交互指南(Guidelines for Human-AI Interaction)》当中对此做出更新陈述。
在某种程度上,人类好像更倾向于在接近终点时才真正开始认真考虑问题,但这无疑为时已晚。一位我觉得不太适合公布姓名的同事曾经把目前 AI 行业的工作,描述成“努力给 AI 这头猪涂上口红,希望让它变得漂亮一点”。也正因为如此,目前设计与 AI 的前沿体现为探索设计师们该如何将机器学习作为一种设计素材。这项工作的核心要点,在于教会设计师们如何看待机器学习。这不仅是要思考如何在界面当中向用户呈现确定性较差的 AI 结果;相反,其核心应该是如何找出需要解决的问题,归纳出能够使 ML 方法与人类期望相匹配的问题内容,最后确定哪些问题可以被转换为已经得到良好解决特定用例。
设计要素,正迅速成为同类产品之间的关键差异化因素;换言之,那些能够更好地运用机器学习成果的设计师,最终将为我们带来最大的技术价值。
计算社会科学
机器学习正在探索我们所做的一切,因此我们应当认真考虑机器学习的含义,以及我们可以采取哪些措施来减轻其负面影响。计算社会科学家们带来的方法,倾向于更多以面向人类的方式进行研究,使用人机交互中体现出的各类技术,并立足调查、访谈、日志分析以及民族志等素材从心理学及认知科学等基础领域借鉴宝贵经验。
这些技术已经对用户如何理解(或者误解)作为其交互对象的算法(例如 Facebook 的新闻推送、可能导致极端主义思潮的 YouTube 推荐系统、识别社交媒体内虚假新闻传播活动的机制、用户界面元素如何影响在线会话以及用户对于网络隐私问题的认知等等)给出了深刻的见解。
人机交互在识别或解决这些问题方面并不具备垄断能力,但考虑到我们自身既是创造者也是设计师,人机交互在揭露与干预此类问题当中确实拥有着不可替代的独特地位。
以上只是我个人对于人机交互相关工作以及即将到来的 AI 之秋趋势的简要概括。
总结陈词
“只要保质保量把工作做好,一切就都会好起来!”……在 AI 领域,人们越来越清醒地意识到 AI 之秋即将来临,因此要想在这一领域保有必要的技能与存在感,人机交互绝对是个不容忽视的重要领域。
[1] 这句表述援引自 Gierad Laput(http://jeffreybigham.com/blog/2019/the-coming-ai-autumnn.html),我并不确定其在技术层面是否准确,但我认为它能够很好地向计算机科学家们解释,为什么计算机科学很难重现人类天然具有的种种能力。
【来源:AI 前线】