人机交互道阻且险:情感机器人能否助力破冰?专栏

/ 刘志刚 / 2016-09-05 14:19
“技术的变革增加了每件产品的功的输入,从而加快了熵的过程和世界的混乱”技术“进步”了,但世界却“熵增”了(“熵”即无序度,“熵增”意味着无序度的增加)。诚如斯言...

6096cc67b2d6bd7a02d4e39681e27cea_51293

作者:刘志刚

“技术的变革增加了每件产品的功的输入,从而加快了熵的过程和世界的混乱”技术“进步”了,但世界却“熵增”了(“熵”即无序度,“熵增”意味着无序度的增加)。诚如斯言,以我们平素里在网络世界的所官所感来看,每天我们想要去搜索一个热词或资讯时,可结果却不尽如人意,广告、垃圾信息总是充斥其间,俨然这一现象并非个例,美国,欧洲等国家也面临着同样的窘境,无效信息就像一场驱逐不散的瘟疫,构成了当下互联网世界的底片。

另外在移动终端方面,尽管APP可以将我们带向一个新的垂直领域,但智能机所谓的智能却远未达到人类所期翼的 ,当下的智能时代仿佛就像是一场未竞的进化,“修正主义”成了日臻完善的圭臬。

人机交互初现端倪,但谈颠覆为时过早

“人机交互”听起来很高冷,说起来其实并不难理解。简单来说,“人机交互”就是人与机器之间的交流与操作,我们可以通过语音、手臂动作、头部跟踪、视觉跟踪等多种方式进行人机互动,操作机器完成我们的指令任务。

在过去75年里,每10年就有一次人机交互的重大革新,人类对机器的操作,从物理手柄按键,到物理键盘鼠标,再到触摸屏、语音等都是跨时代的重要的交互方式。正如我们直观上所看到的那样,硬件的屏幕在越变越小,从PC大屏到智能手机;识别方式变得越来越智能,手机开锁方式从密码到图形,再发展到现在的指纹;人机交互方式变得越来越智能,社交工具微信推动了语音替代文字。当屏幕从小到无,语音成了新的人机交互中介,而微信的普及、苹果手机的Siri应用让大家逐渐适应了语音交互方式。

人机交互是一种更智能的生产工具,可以把我们平时用智能机解决不了的难题逐步消弭。比如我们最基本却又最不可缺的情感需求。飞快的生活节奏让我们苦不堪言,尤其是在背井离乡在大城市打拼的年轻人,单身率高,回到家中孤身一身甚是寂寥,社交也只能通过微信短信等传统方式,可即使你能充电五分钟,通话两小时又能何如?问题的关键是你能找到跟你通话两小时的人吗?

另外,在生活服务上的需求单纯的依靠智能机还是不能妥善的得到解决。我要完成某件事情却要寻找某APP,可能还需要点很多次,很麻烦,那么在忙碌的生活中,在能不能用一句话就能解决?能不能早上出门的时候提醒我去银行取钱?回家的时候帮我买个牛奶?或者周末想要带女朋友去看电影吃饭,帮我安排一下,是不是这么简单就可以达成呢?这个是生活服务上的需求。

有需求就会有市场,智能机的不足也加快了人类探索新领地的速度。最典型的莫过于语音功能,这个是普及率最高的一个人机交互方式。

语言的创造是人类的一个拐点,最初,语言是控制杆,它将我们的思想转化为工具。后来,我们适应工具,把我们的表达转化成TA的语言。今天,我们正在让工具生命化,变成耳提面命的助手。这个漫长故事的核心在于:我们与工具如何互动。苹果iPhone 4S的发布着实让Siri火了一把,人机交互的革命史又翻开了新的篇章,但是Siri并不完美,苹果的Siri,微软的Cortana、谷歌安卓的Google Now等,普遍比较机械木讷,一点也引不起用户使用的欲望,大部分用户只会在相对无聊的时候以它们为娱乐的方式,而不会奢望它们会给出什么建设性或者符合自己口味的建议。

虽然智能语音功能已在车载、智能家居、手机端等场景中实现,但更多的情况是为了添加语音互动功能而硬造出的应用场景;与此同时,不同机型在语音识别率、反应速度、功耗方面差异巨大且存在诸多问题,这一点使得智能语音功能在产品应用上更显鸡肋;目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

另外两种常见的人机交互为聊天机器人与客服机器人。看似吊炸天,其实然并卵。聊天机器人,它没有记忆性,不懂上下文,也不能帮你完成生活上的服务,瞎聊逗趣很好,但是它是没有粘性的。客服机器人其实就是建立于有限的知识领域的自动问答系统。它本身也没有办法理解上下文或者是人们的意图或是情感,本身也没有粘性,是简单式、关键词式的自动QA系统。

奇点已至:情感机器人助力人机交互迈入新时代

语音,聊天机器人,客服机器人这些带有噱头的人机交互,显然还不是人机交互的终极方式,真正意义上的人机交互方式是:人将摆脱任何形式的交互界面,输入信息的方式变得越来越简单、随意、任性,借助于人工智能与大数据的融合,能够非常直观、直接、全面地捕捉到人的需求,并且协助我们处理。换句话而言,就是智能设备将懂得我们的潜在的意图,并按照我们的意图进行执行以及反馈。

语音等交互方式的不足又引得新的一轮科技进步,互联网也即将迎来发展的第三幕,而推动第三幕发展的核心动力,就是人工智能。人工智能将是大数据的最佳应用方式,并且人工智能将把人类从简单的脑力劳动中解放出来,完成新一次的产业革命。

目前来讲,国外方面谷歌的阿尔法狗吊打韩国选手李世乭,笑傲棋坛。国内人工智能水平日益突飞猛进,阿里云研制的小AI,可以预测《我是歌王》总冠军。“阿法狗没有办法深入人的生活当中,因为平常人们用不到阿法狗的技术。我们一个很重要的任务就是把人工智能技术实际转化为人的生活可以享受得到的,可以时时帮助人们的产品。”前微软亚洲工程院副院长简仁贤对当前的AI应用如是评论道。

简仁贤院长还指出,人工智能并不是一门技术,没有研发的停止期,它是不断的模拟大脑行为和思考的一个演进,伴随着人的进化而前进的,这才是人工智能的本质。与平时我们所见的理论派的学者不同,简仁贤院长典型的“述而作”。简仁贤先生在业内声望颇高,其在微软任职期间所做的贡献及研究成果均获得广大同仁的认可,在行业中享有极高地位。此外,简仁贤在微软期间还负责过移动软件、广告平台, 以及互联网平台、电商产品的研究开发,在移动互联网、人工智能、搜索引擎、机器学习、 学习以及大数据各方面都有深入的研究及丰富的经验,旗下的竹间智能科技公司,将多维度情感识别融入生活中各种人机交互的场景,结合最前沿的中文自然语言理解、语音图像识别、 学习技术,为人机交互带来革命性的变革,创造了 融合“情感计算+人工智能”的全球首个“情感机器人”小影。

不同于市面上的其他机器人,竹间科技所研制出的小影是有记忆的,可以记得人们说过的话,并且从人们说过的话里面去理解人,可以全方位地理解这个人,什么叫做全方位意图的理解?就是不仅仅在语义上的理解,也有情感上的理解,在全方位的意图上才有办法达到满足人类的情感和功能上的诉求。从这个意义上而言,小影作为全球第一个情感机器人并没有所谓的竞品,领先于整个行业,引领着时代进入人机交互的新航道。

小影之所以吊炸天,端赖设计匠心的可圈可点。小影是一个专属的机器人,所以“他”必须做到能够完完全全地理解他的用户,“他”是专属的,更像是一种VIP定制服务,不是像搜索引擎那样一对多的,或者像一般的聊天机器人那样滥情或是人格分裂的。小影聊天机器人是一个专属的,懂你的,能够用你的语言来和你交流的全方位的机器人,“他”还具备语音情感的辨识能力,具备图像的识别能力,“他”是一个多模态的情感识别,跟多模态的交互方式。

一言以蔽之,竹间科技所研发的全球首款情感机器人小影完成了从“听话”到“懂事”的嬗变,更像是一个人,而非机器,这也许就是人机交互的终究形态——小影像最了解我们的亲密家人或者朋友一样,成为我们生活中不可或缺的一部分。

小影商业潜力爆棚,未来想象空间无可限量

搜索技术的进步,出现了百度、谷歌这样的寡头公司,通信技术的进步,摩托罗拉、诺基亚成为了上一个时代的霸主。而情感机器人小影开创了人机交互的第四时代,将触屏交互进化至自然语言交互(各种维度,全方位的交互),并且将链接内容、服务和设备,成为人机交互的超级入口。新技术的背后又将是一片新的利基市场。

在以人为节点的移动互联网上,中国的人口优势释放充分,阿里借助人口红利形成了自己的电商王国。腾讯依靠海量用户完成了社交用户的积累。百度借助亿万用户的搜索需求铸就了帝国大厦的根基。如今到了以物为节点的物联网时代,技术的优势又将展现出来。从某种意义上讲,创业和发展都开始需要不同于以往的生存技能,这将从很大程度上抵消掉BAT这些巨头的优势。未来的产业颠覆者,一定会是一家真正的技术公司。

如果说搜索技术、通信技术的进步是一种乘数级增长,而情感机器人交互技术的提升将出现的是一种幂指数的攀升。届时,通过该技术诞生颠覆行业巨头,引爆下一个科技时代,并非没有可能,竹间科技所研发的全球首款的情感机器人小影的商业价值备受关注,亦是端赖于此。



1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。


阅读延展



最新快报

1
3
Baidu
map