早在多年前,资讯业界便已投入许多心力在语音辨识技术上,初期多在语音的正确辨识,如何将说出的话辨识成正确的字词。进一步的,业界开始将正确辨识出的字词用于电脑操作,例如喊「重新开机」,电脑就真的重新开机。

(source:icdn3.digitaltrends.com)
(source:icdn3.digitaltrends.com)

更进一步的,业界开始将人工智慧(AI)技术引入,如何让电脑了解说话者的语意需求,从而由电脑提供解答,例如画面结果显现或语音回覆,此方面以2011年Apple为iPhone提出的Siri语音辨识而受到更大的重视。

当然,也因为半导体技术进步与Internet普及,使广大群众的语音命令可以集中回传,由远端伺服器群大量学习,让语意辨识精准度大进。

为因应Siri,2014年4月Microsoft揭露其Cortana语音辨识技术技术,可用于多种装置上,包含​​Windows 10电脑与平板、Xbox One游乐器,Microsoft Band/Band 2智慧手环,甚至是Android、iOS上。

在Apple与Microsoft后,Amazon也加入战局,于2014年11月提出Amazon Echo装置,初期只提供给Amazon Prime的用户或受邀的用户,2015年6月正式全面发售。 Amazon Echo放置在家中,只要先呼喊「Alexa」,而后讲出您的需求,例如要查天气、要查球赛比数等,Amazon Echo就会用语音回覆。

有趣的是,Amazon Echo的相关技术有开放出来(专案名称:Raspberry Pi + Alexa Voice Service),有兴趣的人可以下载其软体,安装到树莓派(Raspberry Pi, RPi)电脑上,用树莓派电脑实现与Amazon Echo相同的家庭语音应用。

到了2016年5月Google也加入战局,提出Google Home装置,其语音辨识技术为Google Assistant,与Amazon Echo相同,是采放于家中,供所有家庭成员口语询问、口语听答的语音辨识、人工智慧装置。

关于Amazon Echo、Google Home这种新兴装置目前有两个中性代称出现,一是简单称为Smart Speaker(智慧喇叭),另一则是比较绕口的Voice-Enabled Wireless Speaker(语音启动的无线喇叭) 。

Smart Speaker硬体产品算是登场了,但市场会否就此开展呢?可能有些疑问,一种看法认为,回家之后将iPhone采在客厅中央,并启动Siri功能,功效类同于Amazon Echo、Google Home,因而没有市场。

另一看法认为,Smart Speaker可以视为无线蓝牙喇叭的功效规格升级,追加麦克风、追加语音辨识与云端连线等,是现有无线喇叭市场的扩大。如果Smart Speaker市场真的开展,Apple也不会太担心,Apple现有居家产品进行些许改版,如AirPort系列、Apple TV等,一样可以轻松进入Smart Speaker市场。

即便Smart Speaker市场开展了,硬体市场也非重点,目前看来Amazon Echo还可以卖179.99美元,虽然还不知道Google Home要卖多少钱,但一个35美元的RPi也能达到相近的功能,未来必然会快速降价,成为红海市场。真正的重点是如何从语音过程中产生商机,如电子购物下单,或某种语音收费订阅服务等。

再换另一个设想,Smart Speaker快速普及,硬体价格低到某个程度时,Amazon、Google有可能放弃官方版硬体,而采行软体技术授权认证,未来这类产品的包装盒上有可能出现「Powered by Google Assistant」或「Amazon Alexa Certified」等字样,事实上这些语音辨识技术业者也是期望能做到各装置均可用,实现Siri Everywhere、Cortana Everywhere愿景。

最后,居家语音助理过去不是没有失败的例子,法国Violet公司的娜芭兔(Nabaztag,2005年即发展,2012年新版改名Karotz)似乎就没有更大更快速的发展,日本也有许多家庭语音助理产品,能够遥控家电,同样未有更大市场。相近的技术与应用,换成科技大厂主张与提倡,是否就能获得广大回响,仍有待观察。