语音交互:4G之上的智能手机革命观点

/ 朱翊 / 2015-01-09 15:22
语音交互是智能手机等终端产品身上最便利的输入工具,从2011年iPhone 4s首次集成siri至今,语音交互应用历程仅仅走过三四年时间,但在这短暂的应用时间中,语音交互的价值...

语音交互是智能手机等终端产品身上最便利的输入工具,从2011年iPhone 4s首次集成siri至今,语音交互应用历程仅仅走过三四年时间,但在这短暂的应用时间中,语音交互的价值和效应已经得到凸显。而随着目前3G、4G网络全面繁盛的状态,未来的语音交互将在生活、通讯、学习和工作中扮演更重要的角色。

1、手机语音交互:siri开创先河

2011年,苹果公司发布新产品iPhone 4s,苹果首席执行官提姆.库克在讲述其新功能的时候,隆重介绍了其内置的一款叫做Siri的语音助理产品。之后,随着iPhone 4s发货量普及全球,这款有着中规中矩发声的语音助理软件也随之走向世界。再这之后的数代苹果产品中,苹果公司都无一例外地内置了该款应用,并且使其通过语义学习而变得更加智能、便利和精确。

siri虽然只是一款普通的语音助理软件,但其却对后续的智能手机发展产生了重大的意义,这在它盛行后有大量的追随者相继涌现的现象便可一窥端倪。究其原因,是因为siri解放了用户双手,让用户在操控智能手机的时候有更多选择,另外,siri的语音控制方式还能让用户在获取查询结果方面更便利。对于普通用户,siri开创了一种新的交互方式。

但siri的天生自豪之外,却是它的天生难堪——它成名于傲慢的苹果世家。

苹果公司拥有无与伦比的设计与产品体验优势,能为全世界的用户创造超越想像力之外的创新产品,但在siri身上,苹果公司并未让它的这些天赋在siri身上得到全面的绽放。因为,siri作为一款领先的智能语音交互工具,其诞生的早几年只在英语市场有着强烈应用频率,而在其他语种地区,siri的表现就不再出众。

siri这种顾此失彼的情况造就的结果,则使得大多非英语地区的市场迎来了全新的自我成长空间。在中国,科大讯飞旗下的讯飞语音、搜狗、百度等等公司在语音领域方面也下力凶猛,小米、魅族、中兴等智能手机厂商也已经全面融合和接入了语音助理需求等服务。中兴手机刚刚推出的“星星2号”手机,是一款系统级、全嵌入式的穿透使用语音助理手机,其不仅识别率更高,响应速度更快,而且还融入了体感技术。

2、趋势:语音交互融合智能终端

iPhone之后,其他手机厂商纷纷介入语音助理领域。

这种趋势带来的结果是多方面的。一方面,大家争先恐后的涉足直接推动了语音交互的流行程度,但另一方面,不同厂家因为不同技术实力差异而导致的语音交互体验差距,也让不同消费者的感受是不一样的。这其中的主要缘由,在于大多厂商都是在基于第三方语音识别的基础上进行二次优化或开发,但大多开发者因为技术水平的不同,因此导致了最后真正做出有语音识别交互水准的往往都是大公司。

苹果公司早在推出siri的前6年就开始筹备相关项目,而中国本土最富盛名的语音识别公司科大讯飞,其业务本身就是一家专业处理语音识别技术的公司。而百度、搜狗等公司在语音识别方面的优势则在于大数据——它们依赖搜索引擎进行海量的语料库累积,这些语料库被当作为语音识别的参考资料库的情况下,其为用户提供的语音识别功能也即有了无可比拟的优势。

这种优势体现在产品身上的直接结果,便是消费者可以直接享用到天然的技术积累优势,比如在中兴最新的星星2号手机上,消费者可以通过语音控制完成拍照、应用开启及驾驶模式下的导航与音乐等生活娱乐功能;在语音技术的基础上,星星2号上还融入了体感技术,结合二者优势,让语音操作在便捷的同时也更自然。另外,借助距离传感器和光线传感器,星星2号在点亮屏幕后无需解锁和手动调出联系人即可拨打电话。

诸如此类,这些依靠语音交互而实现体验更加便利的方式,正是时下智能手机正在践行着的事,而在其他终端领域,语音交互的应用实践也在一步一步地显现。

特斯拉广为人知的缘由是其属于电动车,但事实上,通过语音交互实现驾驶者更多需求的功能探索,目前也已经成为包括特斯拉在内的大多 厂商在研发的焦点。对于在行驶途中有额外交互需求的驾驶者来说,语音交互是最为合适和恰当的方式。在其他领域如医学、教育、精密仪器等等领域,语音交互的高效和便利一样适用。

未来的语音交互不仅仅只局限于智能手机, 、家庭娱乐中心、政府部门或是其他相关机构,都能借助语音交互方式实现人力成本的减少但工作效率的提升。

3、4G潮流:智能手机提携语音交互

语音交互在过去很长一段时间里并未受到重视,这是由当时的网络状况决定的,在过去的时代里,3G刚刚诞生、2G无力承担一切的情况下,再优秀的语音交互也无法施展全部风采。但在信息技术的浪潮下,4G时代的全面来临,给予了语音交互巨大的成长空间。正是在这种3G鼎盛、4G繁盛、虚拟运营商也接踵而出的背景下,移动网络的时代正全面到来。

智能手机上的语音交互应用可为用户提供信息查询、需求处理、生活服务处理等需求,因此基于高速的3G和4G网络,语音交互可以无障碍地实现生活、工作和学习的更高效率化。这种状况在过去需要依赖114等信息台帮助完成的情况,在今天却只需要消费者个人直接对智能手机说出需求即可。

当前的语音交互在使用与练习过程中,会通过不断的自我学习达到新的理解程度。在现有的大数据、云计算和人工智能日趋取得突破的前提下,语音交互借助3G、4G高速移动网络的时代已经全面来临。特别与智能手机形成相辅相成的方式,更让语音交互在未来更加细致地融入每个人的生活与学习。

而目前随着科大讯飞、中兴等在语音交互方面的发力,未来不久远的语音交互或许将迈上一个新的台阶。

4、语音交互挑战:急利于心or静炼修成

语音交互作为最适合当前智能终端使用的输入式方式,目前其作用已经得到应证,未来随着越来越多行业的加入和发展,其价值和商业效应还会得到更大的体现。在控制、传达、理解与协调等日常程序中,语音交互的便捷、易传达、高效、便利等特征将会带来事半功倍的效果。特别对于无法打字或知识文化水平有限的用户来说,语音交互的实质价值将影响更深远。

不过,语音交互作为一项需要深厚技术积累、海量的语料库积累而成的新型信息科学,需要以时间、优秀的精准人才,以及强有力的技术及硬件作为支撑,在经过周密而繁复的分析和计算之后,才能得到些许科学成果。这是一项枯燥且投入巨大的工作,没有充足的回报诱惑,很难在短期内获得成功。

正是在这样的情况下,一些急功近利的机构或个人无法保持科研的初心,依靠各种取巧方式试图走捷径。这种方法虽然于情于理都不会被容许,特别对于科研精神和科研态度而言,这种走捷径的方式虽然一直不耻于业界,但近年来仍有个别公司一直未放弃这种“努力”。

然而,所幸还有一些领先的语音交互研发公司保持了对技术的坚持,科大讯飞、中兴、百度、腾讯等等公司在这方面都已取得不错成绩;而在成果转化和落实方面,中兴星星2号等一些革新二代语音交互手机产品的问世,也已经为行业掀起

--完--

作者简介:朱翊,中国第一批blogger作者(11年blog写作经历)。知名意见领袖、互联网媒体人,逐一传媒公司创办者。长期关注互联网商业趋势与案例研究,涉猎TMT、移动互联网、电子商务、品牌传播与管理、家电数码等领域;目前从事公关、营销、品牌等管理工作。个人微信号:izhuyi;个人公众平台帐号:zhuyiweixin



1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。


阅读延展

2014/1218/1418888953297.jpg

朱翊

朱翊,中国第一批blogger作者(11年blog写作经历)。知名意见领袖、互联网媒体人,逐...


最新快报

1
3
Baidu
map