三星正研发项目代号为Vega的智能音箱,这款音箱为三星的智能助理Bixby所支持。据称,Vega已研发了一年有余,不过许多功能和设置依然没能确定下来,因而发布时间也未可知。
目前,智能音箱市场竞争异常激烈。三星在此时加入这一市场,目的是与苹果HomePod、亚马逊Echo以及Google Home等同类产品进行竞争。实际上,更深层次的原因在于智能音箱市场前景极为可观。
可以说,智能音箱的出现,实现了人类由触控到声控的转变。许多业内人士和科技公司都认为智能音箱会成为未来智能家居的控制中枢。作为智能家居的入口,智能音箱市场愈发火爆,也蕴含着广阔的前景。但是,智能音箱在发展过程中仍会碰到许多限制性因素,因此能否成为“超级产品”还有待商榷。
一、智能音箱市场竞争激烈,未来或成智能家居入口
三星在此时加入智能音箱市场,正赶上竞争异常激烈之时。
据市场研究机构Strategy Analytics预测,智能音箱正大受欢迎,预计到2020年,全球销量可达1500万部。
其实,智能音箱发展的时间并不算太长。2014年,亚马逊在官网中低调推出了Amazon Echo智能音箱,甚至都没有为其举办一场发布会。但随后却呈现出“低开高走”的局面,Amazon Echo逐渐进入消费级市场,受到了用户的青睐。2016年,亚马逊Amazon Echo销售量超出1000万台。
同年,Google正式发布了Google Home,标志着其正式入局智能音箱市场。之后,谷歌与亚马逊一道,成为了智能音箱市场中排在前两名的公司。根据VoiceLabs发布的美国语音智能音箱市场的研究报告来看,亚马逊占据了美国市场70.6%的份额,谷歌则占据了23.8%的份额,而其他品牌总共才占据了5.6%的份额。
不过,之后又有巨头入局。今年5月,微软在Build2017大会上宣布与哈曼卡顿联手推出内置其人工智能助理“小娜”的智能音箱Invoke。
而在WWDC 2017上,苹果也正式发布了搭载Siri语音助手的智能音箱HomePod。
由此可见,智能音箱已然成为众多科技巨头的又一个“新战场”。那么,这一市场的魅力究竟何在呢?
首先来想象两个场景。
1.炎热的夏天,忙碌了一天之后,拖着疲惫的身子下班回家,打开门,打开玄关的灯,奔向松软的沙发,此刻你只想好好休息或者看个电视,结果怎么也找不到电视和空调遥控器了。
这时,如果有智能音箱,你就可以发出一连串指令:“Echo,空调开到23度”、“Echo,打开电视”、“Echo,帮我泡杯咖啡”、“Echo,把窗帘也拉上”……
2.寒冷的冬天,洗漱完毕,上床打开灯看了会儿书,再看会儿手机,被窝里也暖了。刚想躺下睡觉,发现客厅或卫生间的灯没有关……
“Google Home,关掉客厅和卫生间的灯”。
这些场景都会时常出现在我们的日常生活中,而智能音箱所提供的语音交互无疑是种最好的方式。
十年前,iPhone以手指触控替代了按键触控,这一变化具有划时代的意义,因为触控比键控更接近于人类本能。如今,智能音箱以语音交互替代触控同样具有重大意义,因为动嘴比动手更接近于人类本能。因此,下一代的革命性产品必然要将人类从“动手”中解放出来,智能音箱恰好能承担这一责任。
当下,语音交互的环境正向成熟的方向迈进,语音识别技术有了巨大的提升,而且仍在不断提升中。网络基础建设愈发完善,速度也有了很大的提升,极大程度上缩短了响应时间。毕竟正常的对话需要实时反馈,而这种变化让语音交互更加便利,有利于以这一技术为主的智能音箱进一步渗透至消费级市场。
现代人的信息化程度越来越高,这是基于近年来逐渐健全的网络基础服务的培养,如电商、O2O、流媒体、智能家居等。此外,AI及搜索技术的发展也功不可没。虽然与国外相比,中国网民在这一点上仍稍显欠缺,但也取得了显著的进步。
在高度信息化的时代,语音交互方式要比点击、滑动更为自然和直观,因为人类文明最初就是在语言和交流中诞生的。语音交互技术的普及,能够解放人类的手和眼,让人们做到“一心二用”甚至是“一心多用”。在提升生活质量的同时也节省了时间,符合现代人快速的生活节奏。
在国内,智能音箱虽然还未普及,但也有不少公司开始涉足这一领域。如华为推出的小天鹅蓝牙音箱、小米智能音箱、京东智能旗下的叮咚智能音箱以及阿里即将发布的“天猫精灵”等。不过就整体市场来看,中国的智能音箱产品还是更多地侧重于音乐播放甚至儿童早教方面,虽然也能起到控制智能家居设备的作用,但远未能达到Echo的整合程度。
就当前的发展形势而言,作为智能家居的入口和语音交互技术的实体产品,智能音箱未来前景极其广阔。然而,目前的智能音箱在技术和市场等方面仍受到诸多限制。
二、智能音箱受诸多条件限制,短期内难成互联网“超级产品”
有观点说,音箱会成为物联网时代的“超级产品”。其实,这个理论过于绝对化了。
不可否认,通过语音交互实现对智能家居的控制会成为未来物联网发展的趋势,但音箱只会作为入口而不会成为中心。尽管智能音箱优点颇多,但其限制条件亦不在少数。
首先,智能音箱放置地点通常较为固定,移动属性不高。这意味着需要语音交互时,发出指令的人必须要与音箱保持很近的距离,目前的技术水平最多能在无遮挡的情况下做到5米之内。
想象一下,在这种技术限制下,我们在厨房做饭,在卧室睡觉或在浴室洗澡,而音箱放在客厅。我们想要下达指令的时候,正常的语音交互就几乎变为了不可能。想要解决这个问题,要么每隔一段距离就放置麦克风阵列,要么就提高嗓门大喊,可这样一来不是不经济就是体验太差,语音交互也就没有太大的意义。
此外,目前许多语音识别技术在进行交互之时,需要用户一字一顿的说话才可以。这种限制需要用户付出更多的时间和情绪成本,是非常反人类的。笔者在智能手机上就遇到过这种问题,就算一字一顿的说普通话,语音助手也不能完全正确识别,导致语音转文字后还要逐个手动修正。既破坏心情又浪费时间,反而不如直接打字来的痛快。
由此看来,智能音箱确实还存在着诸多问题。有人说,智能家居的杀手级交互应该是手势。其实不然,因为目前消费级市场中优秀的智能音箱已然证明了一个事实,即语音是安抚无陌生人家庭场景的最佳方式。不过,尽管智能音箱市场火爆,但要成为“超级产品”,可能性确实不大。
那么,真正的下一代语音识别技术又该是怎样呢?
真正意义上的语音识别,应该不只是语音识别,而是一个“超级大脑”。不仅能识别普通话和方言,还可以作为AI系统。通过深度学习和云计算等先进技术,识别特定用户的特质嗓音和说话习惯,甚至是因为生病等原因而变声的语音也能精确识别。也就是说,只要是你身边的亲朋好友能听懂的话,智能语音系统也同样能听懂。
此外,真正的语音系统应该能够做到减噪。受使用场景的限制,目前语音控制和语音输入在一个人的环境下还算好用,但在公共场合中使用就难免会受到噪音干扰以及泄漏隐私,这在一定程度上限制了语音习惯的养成。针对这种情况,未来语音识别可能在极致减噪的同时能够准确识别微小的声音,甚至能够识别近乎无声的“唇语”,从而让语音识别慢慢渗透到生活中的各种场景,最终成为主流。
就市场层面而言,要将这些设想变为现实,可能会有几个发展方向。
一是智慧语音输入法。企业能针对每个用户定制独一无二的语音数据库。这个数据库中沉淀了特定用户的特质嗓音和说话习惯。同时能够结合人工智能,猜测出用户还未讲出的话。
二是跨平台语音操作系统。这属于用户的个人语音数据库,平时在云端存储和运转,能够通过个人账户自动上传或下载,在任何智能家居和车载设备上都能下载使用,不会再出现人去适应机器的情况。
三是互联网时代的超级入口。一个搜索需求可以成就谷歌和百度,那么可以推断,未来的语音操控和语音输入可能会成就更大的互联网巨头,也会成为全球用户连接互联网世界和物联网世界的最大入口。
四是大数据时代的超级服务商。作为超级入口的语音交互,不仅能够积累用户的语音习惯,还能积累用户的生活习惯和即时情况。这种个人的小数据累积起来,就会上升成为社会的整体大数据,这种连接或许将真正构建一个“万物互联”的大数据平台,并构成未来世界所有联结关系的支柱。
总的来说,虽然智能音箱市场目前正处于蓬勃发展态势,但只是作为语音交互的入口而很难成为“超级产品”。而真正意义上的语音交互,还需要很长一段时间才能实现。