帳號:
密碼:
最新動態
產業快訊
CTIMES / 文章 /
後手指時代 人機互動怎麼玩?
Beyond Touch

【作者: 王岫晨】   2012年04月16日 星期一

瀏覽人次:【4787】

人類與世界的互動,是很有趣的一件事情。打從我們還在母親肚子裡時,所有的知覺器官都還發育不完整,沒辦法聽、沒辦法看、沒辦法聞,更沒辦法去觸摸,一切只能憑感覺來了解這個世界,感覺目前所處的環境、感覺周遭的一舉一動、感覺人們的喜怒哀樂。出生後,隨著各種感覺功能的成熟,逐漸可以去看、去聽、去觸摸這個世界。我們和這個真實世界,就在這樣的交流中,互動、溝通與了解。


而現在,當人與機器已經成為密不可分的生命共同體,當0與1的數位世界已經完全與原始的類比感知掛勾在一起,與機器間更為理性而有效率的溝通方式,成為人們汲汲營營追求的目標。


Beyond Touch

在人機介面的發展史上,蘋果公司如伯樂慧眼識千里馬一般,發掘電容式觸控技術的優點,並將其引進到手機與平板等裝置之上,使得電容式觸控的長處得以在行動裝置上完全發揮。扮演伯樂的蘋果,與扮演千里馬的電容式觸控,其貢獻肯定都會在人機互動的功勞簿上被大大記上一筆。


當然,蘋果最令人津津樂道的地方,並非在其選用了哪一種觸控技術,而是蘋果『將觸控優勢完全燃燒』這一回事。其實,積極革新資訊產品的人機介面技術,是蘋果一直以來的拿手好戲,儘管不是每次都成功,然而從iPod開始的i系列商品,不斷有新穎,且真正革命性的互動作法出現。


只不過,觸控到此為止,都還是侷限於透過手指來進行互動的範疇。人們總是希望跳脫平面,來到更高一層的三度空間思考模式。不用手,一定會更快。單純觸控無法滿足人們對於人機互動的慾望,於是感測器大軍揮兵直搗應用市場。感測互動成就了下一階段的人機互動的歷史新頁。


感測打開人機互動新頁

iPhone內建的加速度計所帶來的新奇體驗,不僅造成iPhone的熱賣,也使產業開始重視觸控技術配合加速度計的發展,目前新款智慧手機均以同時支援多點觸控、加速度計為賣點。


但這樣還不夠,除了加速度計,更多感測元件例如陀螺儀(角加速計)、電子羅盤、GPS定位系統、近距離感測器等都陸續被加入智慧手機之中,甚至還會整合壓力感測器來偵測使用者所在的海拔高度。


這種單一裝置中整合多種感測器的多軸感測發展趨勢,不僅讓人機間的互動更『直來直往』,也讓許多電影中的幻想場景開始成為可能。


只要進一步整合這些來自加速度計、陀螺儀、電子羅盤與壓力感測器的資料,便可推測「使用者如何移動」、以及「使用者朝哪個方向移動了多遠」,進一步實現更精確的3D定位,例如可在室內推測使用者行走狀態的行人定位推算(Pedestrian Dead Reckoning;PDR),以及現實真實空間和虛擬空間聯動的擴增實景(Augmented Reality;AR)等用途越來越廣泛。


值得一提的是,有了更多感測元件,應用軟體必須要有能力配合感測器擷取到的輸出訊號,快速且正確判讀資訊,並做出相對反應,其重要性將越來越高。


體感互動強者爭霸

除了智慧手機,遊戲機與使用者的互動,也成為感測器大舉攻城掠地的目標。任天堂Wii一舉革新了遊戲機的傳統操作思維,而微軟的Kinect更讓人機互動一舉躍升到影像感測的更高層級。


事實上,自從Wii打開體感互動的大門後,遊戲機大廠也相繼叩關。Sony在2010年推出PS3,以CMOS感測影像輔以LED光球定位,精細度較Wii更上一層樓。但隨後微軟Kinect又以內建紅外線發射器加上CMOS測距裝置重砲還擊,除了動作定位,還可辨識3D動作。而外加RGB的CMOS感測器更可讓多人同時連線遊戲。


微軟以Kinect打遍天下無敵手,近期微軟更打鐵趁熱推出新版Kinect,除了能和微軟作業系統Windows搭配使用之外,同時也有助開發商擴張Kinect應用市場。微軟的想法顯而易見,想藉著目前佔有率頗高的Windows系統,讓更多專業開發者願意投入為Kinect開發應用,使其未來不論在家庭中或者辦公室、在室內或室外,角色都變得更為重要。


第一代Kinect問世後,便一舉將Xbox 360捧上遊戲機銷量冠軍寶座。2010年微軟就售出超過1800萬台Kinect。Forrester Research分析師James MacQuivey認為,若從人機互動的觀點出發,Kinect將是微軟翻身的絕佳機會。


James說:「Kinect不只是一個周邊商品,而是一個未來。」


微軟亟欲讓Kinect走出遊戲市場,讓體感完全融入日常活動,成為生活的一部份。目前已有350家公司與微軟合作開發Kinect應用,並將其應用於不同場合,例如在波音客機的銷售大廳,能為客人提供一趟虛擬航程;在加拿大的醫院中,外科醫生只需透過體感控制,不需要使用沾滿細菌的手去碰觸設備;不久的未來,百貨商場也可以直接透過Kinect來掃描客人體型,測量尺碼,來推薦適合的服裝。


而為了鼓勵開發商發展更多應用,微軟也與TechStars共同發起一個Kinect Accelerator活動來發想創意,並為剛起步的技術公司提供技術指導與資金。該活動至今已經開發出499種應用。


這些應用目前暫時都無法透過iOS與Android的行動設備來使用,唯有透過Windows系統才能體驗全貌。也因此,Kinect被視為Windows的救世主。然而James認為,Kinect想要進一步走入生活中,除了需降低價格,更需要一個真正具殺傷力的應用,來讓Kinect成為必需品。而尺寸更小,更便於攜帶當然更加分。


「現在萬事俱備的微軟,大概就只欠東風了」,James說。


『出一張嘴』的聲控體驗

從手指到體感,這些人機互動方式都還是需要人們去『動作』來控制機器。然而像電影中那樣,人們只要輕鬆出一張嘴,機器聽到之後就會自動會去完成所有工作的場景是否存在呢?


當iPhone 4S問世之後,透過聲音的人機互動方式終於露出了曙光。這個稱為Siri的語音技術,是人工智慧、自動學習加上情境感知系統的綜合體。Siri一開始的雛形,是1960年代美國國防部的『複雜情境電腦智慧能力發展』計劃,這個研究計劃在專家與企業資助下發展了長達40年以上。


開發Siri的同名團隊,被蘋果看中了其語音辨識技術的優勢,出資2億美元,在2010年收購該團隊。蘋果獲得了該研究成果,因此擁有人機對話,以及自然語言理解、機器學習等技術。


Siri的出現,歸因於語音辨識及人工智慧發展的突破,加上電腦運算與作業系統工作能力有了大幅成長,另外摩爾定律的加持、配合網際網路普及與蘋果本身的硬體整合能力,在對的時間加上對的科技,Siri也由此誕生。


根據使用者測試,發現Siri的學習能力非常高。不僅可學習使用者口音及聲音特徵,還可自動紀錄名單上沒有的人。此外,使用者也可以要求Siri讀出簡訊內容,再透過Siri來直接回覆,並可在寄出前先讀出內容,讓使用者確認無誤後再送出。


要想更了解Siri的精神,可以看看蘋果全球產品行銷資深副總裁Phil Shiller所談及的這一段話。


他強調,Siri的設計理念,是希望能讓裝置跳脫過去只能利用單一字彙你問我答的傳統模式,讓裝置可以直接辨識發問者的完整提問內容,甚至是隱藏在文句之後的深層意思,同時也能支援不同的回應方式,讓系統能以更『自然地』與使用者互動,提供所需。


Android陣營推Iris回擊

號稱人工智慧的Siri聲控功能,一問世就造成業界新震撼。新的問題是,別的陣營該不該跟進聲控功能呢?目前緊咬蘋果不放的Android陣營深怕一個不小心又再度落後,因此已經有了動作。例如dexetra.com便積極發展以Android為基礎的聲控程式,並將其取名為「Iris」。這可有意思了,仔細一看會發現,這正是Siri倒過來的寫法,似乎意味著Android抗衡蘋果的強大決心。


看來,蘋果的每一步,的確讓競爭對手步步為營。但面對如此智慧化的對手,Android陣營也不甘示弱。


其實,以Android為基礎的語音識別系統目前已有Speaktoit Assistant這套軟體。但dexetra.com團隊進一步利用Android語音轉文字(speech-to-text)技術,搶先推出Iris的最初版本。這套聲控系統目前已經可以辨識包括轉換率、藝術、文學、歷史和生物學等基本主題,問它2乘以8等於多少,它可以準確回答出16。


Iris開發商表示,這套最初版僅花了8個小時便完成,目前也可免費下載。不過,這是最初版本,因此進步空間仍很大,例如問題的反應速度還是過慢。當然,Iris在未來不斷開發新功能,陸續進化之後,以目前Android系統市佔第一的情況來推估,Siri很可能反被壓得喘不過氣。


Intel打造聲控Ultrabook

打造行動平台不遺餘力的Intel,想將自家處理器平台推向行動市場高峰,自然也不會看輕聲控技術,特別是在Ultrabook的產品推廣上。


Intel與知名聲控軟體公司Nuance合作,運用的是Nuance的「Dragon」語音辨識科技,來開發專為Ultrabook設計的直覺式互動的聲控程式。Dragon聲控技術為Dragon Naturally Speaking聲控軟體的核心技術。讓使用者可以透過自然的對話方式控制裝置,並藉此啟動應用程式、播放多媒體、與社群網站互動並操作電子郵件信箱與行事曆。


事實上,Nuance的Dragon聲控技術已經搶先應用於LG的3D Smart TV的Magic Remote遙控器上。該款Smart TV隨機附贈具聲控、滾輪、神奇手勢以及點選等四種控制選項的遙控器。該遙控器的聲控功能初期可支援美式英語、美式西班牙語、加拿大法語及韓語等。


HMI的未來進行式

目前,人類與機器的互動,仍然是『以手為主、以口為輔』。而人機互動的終極目標,是在於讓機器更為智慧化,主要目標包括以下兩者:


(1) 能自動:未來機器需可自行偵測所處環境、地點、白天黑夜,來自動進行更為體貼的動作,例如自動調整顯示器亮度、或者提醒主人剛路過的商店有折扣等。


(2) 能學習:學習功能如同電影那樣,機器可以透過平常使用習慣,來學習記憶一位或多位不同使用者慣用的模式,當遇到類似的狀況時,不需使用者輸入任何指令,機器可直接執行正確的動作。


在電影中,一般人應該都看過類似的場景,也就是未來人們戴上一個帥氣的眼鏡,就可以透過這個眼鏡看到真實與虛構整合的空間,以及各種環境相關資訊。這種互動科技,其實正是類似今日頭戴式眼鏡(HMD)或者擴增實境的概念,它完全符合自動化與學習化的未來人機互動模式,不需額外輸入指令,便會自動顯示必要的資訊給使用者。


HMD這種頭戴式眼鏡,戴上之後,會有如身歷其境一般的視覺體驗。這種人機介面目前在消費市場主要用於個人化的多媒體享受,例如觀賞電影。HMD主打行動市場,未來說不定會成為智慧手機的周邊配備之一。事實上,HMD這樣好用的技術,早有玩家把它拿來與Kinect一起使用,讓玩家遊歷在虛幻空間之中。


至於擴增實境(AR),則更是虛擬與現實的延伸。


擴增實境這種使用介面,指的是能把虛擬資訊加到使用者感官知覺上的電腦顯示器,大多以透視裝置例如頭戴式眼鏡,把資訊或影像加到使用者所見的畫面上,讓現實世界的場景與虛構資訊結合。這種系統必須追蹤使用者頭部的位置與方向,好讓疊上去的資訊能符合使用者真正看到的世界。


擴增實境系統採用和虛擬實境(virtual reality;VR)類似的硬體技術,但主要差異是,VR是以虛構畫面取代真實世界,而AR卻是在真實世界中擴增資訊。


結語

從手指開始,人類與機器互動的歷史,一路展延,最終的盡頭是什麼?是可直接口語命令機器去做事,還是根本只要透過大腦,想到什麼,機器就會做什麼?人與機器之間,還有無限的互動可能,不論是AR或VR,可預見在未來,除了人、機之外,機器與環境間的感知連結也將成為互動的一部分。如此人、機、地完全無縫接軌,將是人機互動的最終境界了吧。


相關文章
結合功能安全,打造先進汽車HMI設計
HMI人機介面成為智慧廠房的遙控器
強化轉型核心動力 打造更強數位韌性
數位轉型下的工具機發展趨勢
智慧人機介面將產品設計發想變成無限可能
comments powered by Disqus
相關討論
  相關新聞
» AI代理技術正迅速成為企業創新與提升競爭力的重要推動力
» 韓國研究團隊開發超靈敏電子皮膚 模仿人腦神經網絡
» 美國國家實驗室打造超級電腦 顯示異構運算架構能滿足HPC和AI雙重需求
» 英飛凌攜手Stellantis力推下一代汽車電力架構
» 筑波科技攜手UR推動協作機器人自動化整合測試成效


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.191.165.30
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw