随着各项智能输入法的发展以及iPhone 4S 的Siri首开行动装置搭载声控功能的风潮,语音输入也越来越普遍。语音输入之所以会流行,最主要的原因是其有非常合乎人的自然行为习惯,利用机器做语音识别,了解人说话的意图,自动完成各项任务,就是当前最热门的Siri可以达成的事情。
近日,英特尔也积极投入语音识别开发,其实验室展出一款Ultrabook™以及智能会议助理(Smart Meeting Assistant),能够撷取人们的谈话内容,将声音转为文字,并在屏幕上显示实时字幕。随后透过云端翻译服务,就能把对话翻译成母语,相当适用于跨国会议上。
其中,拜赐于自然语音理解(NLU)技术的渐趋成熟,并在个人计算机、行动装置以及电视领域攻城略地,Nuance大中华区总经理郑裕庆强调,通过语音应用,人们无需再历经繁琐而复杂的用户接口操作,只要通过自然语句说出意图,便可直接获取内容。Nuance亚太区高级销售工程总监Stuart Sharpe强调:「简单、快速是我们语音输入追求的目标。」
NLU这样的技术,能够带领语音输入进入下一个层次-语音智能搜寻。要让自然语音理解在第一时间理解并执行,必须仰赖云端背后数据库的建构。Nuance亚太区高级销售工程总监Stuart Sharpe提到:「Nuance主力不在于语音识别这一块,而是在自然语分析,重点在于如何分析、再去理解,给出答案。这样的答案并非是给你多列的网址,而是正确答案。」由此可知,相信,在不久的将来,大街上拿着手机不再是用手机轻轻敲击,而是只需要对着手机说出话,一切事情皆好办。