語音新創應用

作者\詹文男


iPhone 4S的語音辨識及人工智慧,開創未來科技應用上的無限可能。

最近參加一個資通訊產品的創新設計及應用比賽擔任評審,參加的產品五花八門,有智慧型行動裝置、雲端應用、高效能桌上型電腦、聯網電視、遊戲機、數位相機、印表機等等,令人目不暇給。

�s�i

說實在的,各產品都有其獨特的優點,如何擇優給獎對評審真是一大挑戰。因為有的產品以精緻取勝、有的則以設計出線、另有以創新人機介面勝出、也有以性價比來凸顯其價值。尤其『創新』這個用詞,人言人殊,很難有一個共通的準則與判斷的基準,因此在評審過程中引發委員諸多的討論。最後,在投票表決的情況下選出了iPhone 4S。主要的理由之一,在於其透過語音辨識及人工智慧的技術,開創了未來科技應用上的無限可能。

基本上,語音辨識及人工智慧一直是科學上研究的重要主題,但在技術無法有效突破的情況下,應用有其侷限。不過許多廠商仍著眼其未來可能的廣大應用而持續的投入。IBM的華生及Apple的Siri兩個案例,給產業界帶來很大的驚喜與曙光。

IBM過去的電腦『深藍』(Deep Blue),以西洋棋天才棋王Kasparov為挑戰對象,於1997年五月締造了歷史紀錄,讓世界棋王俯首稱臣,榮登世界棋王寶座,亦即史上第一次電腦擊敗了人腦。

在「深藍」之後,IBM再推出「華生」(Watson)電腦,挑戰電視益智節目高手,台灣時間2102年二月17日上午,IBM Watson電腦,順利奪得美國老牌益智節目「Jeopardy!」的頭獎美金一百萬元,成為該節目最新出爐的紀錄保持者。

從技術上觀察,華生電腦的人工智慧比以前的電腦更進一步,能辨識及瞭解複雜變化的人類語言,包括相關語、諷刺和字謎,像真人一樣快。這項科技若能進一步發展,對現實世界的實務運用應會來帶來深遠影響。

而Apple身為新興應用與使用者介面的領導者,在過去發展行動通訊應用之餘,已將多款常見的智慧型行動裝置操作方式轉化為專利,包括在拖曳與翻頁操作上,畫面的小幅度彈回效果,以及一般常見的滑動解鎖功能,以上幾項專利目前均被Apple作為封鎖Android或是其他陣營在銷售至歐美市場時的進入障礙。

去年Apple搭配新機iPhone 4S內嵌的Siri人工智慧助理軟體,其可以協助使用者做許多的語音輸入的應用,例如查詢天氣,設定鬧鐘。使用者可以跟Siri說我要在7點起床,Siri即會設定7點的鬧鐘;或者跟Siri說,在3點要跟某人開會,其就會幫你預定行程。

人機介面的發展不斷演進,從鍵盤,觸控,手勢,一直到語音,人們的理想都是希望能夠朝自然直覺的方式來應用,雖然技術目前仍不夠完美,但已有初步的成效,假以時日,將可更廣泛的應用於各種如醫療、觀光、零售、電子商務---等等產業及市場,未來潛力值得期待!

(作者為資策會產業情報研究所(MIC)產業顧問兼所長)


關鍵字: 智慧型手機   觸控   語音辨識