帳號:
密碼:
最新動態
產業快訊
CTIMES / 文章 /
第九屆盛群盃HOLTEK MCU創意大賽─暢所欲言
 

【作者: 台北科技大學電子工程系】   2015年08月18日 星期二

瀏覽人次:【17344】


聾啞人士在許多場合都面臨溝通之障礙,例如:問路、尋求幫助,以及緊急災難發生等。由於聾啞人士大多以手語作為溝通之管道,不同一般人是以口語作為溝通之管道,因此所使用之手語翻譯系統如何能精準地判別手勢並即時的翻譯發聲便顯得非常地重要。


基於這樣的理由,我們希望打破既有的研究基礎上發展出一套具備準確判別手勢與即時翻譯發聲之手語翻譯系統。同時配合線上資料庫之開發,我們也期待藉由手機軟硬體協同設計的方法來達到即時翻譯之目的。


為了改善先前手語翻譯系統的不便性,我們使用輕薄的彎曲壓力應變計來偵測手部姿態,達到更準確、更方便、更自然、更省電的效果。本作品功能性、創作性、實用性說明如下:


功能性

現在一般的手語翻譯系統都是不便於攜帶的。我們將手語翻譯系統與每天隨身攜帶的手機做結合,只要再帶上一雙手套,喑啞人士就像帶著嗓子出門一般沒有負擔。除了攜帶性,現在的智慧型手機有許多軟硬體,未來可望結合更多應用程式,例如:讓此手語翻譯系統可以直接對手機話筒發聲,讓喑啞人士也能用手機通話;或是開發防災警告系統、結合手勢的手機遊戲等等,以震動的方式讓手機與手套有所互動。


我們以中華民國啟聰協會提供各種手語起源之基本手型為主要資料庫建立之主軸,也以此作為我們手型判別之依據及標準。基本之手型約有60多種,相較於我們設計之手套可排列 組合約一千多種手型(10Bits),除了具備可完整建構現今所有手語之能力,也預留了極大之空間給其他資訊的傳輸,便於日後的擴充。


圖1 : 中華民國啟聰協會提供之 60 種手形
圖1 : 中華民國啟聰協會提供之 60 種手形

創新性

手勢辨識技術停留在影像辨識已經很長一段時間了。想到手勢辨識技術,一般都會馬上想到以鏡頭拍攝手部動作,並運用影像處理技術分析手勢。然而架設鏡頭非常不方便且無可攜性可言,亦容易受到周圍環境的干擾。我們使用彎曲應變計,搭配手機,不但準確,又能應用手機中的許多硬體軟體,且攜帶無負擔, 讓多彩多姿的語音對話融入喑啞人的生活中。


實用性

我們發明的手語翻譯系統是由彎曲壓力感測器的手勢偵測模組和手機所組合而成,能準確判斷、分析出該手部動作反應相對應的動作資訊,此外該手勢偵測裝置內建有藍牙傳送的功能,是主要應用在傳送動作反應產生的訊號,手機則是有藍牙接收的功能,使用者可選 擇使用透過語音包或GOOGLE發聲。透過接收到不同的動作資訊來發出手勢對應的聲音。本案能將所欲傳達的手部動作反應經由手勢偵測裝置之彎曲壓力感測器偵測出的動作資訊經由藍牙傳遞到手機,大幅地提升了判斷的準確性,當使用者欲透過手勢來表達想法或語言時,經由此系統,將大大地降低了用手勢溝通的障礙,並且可以避免不同人對手勢動作的主 觀意思解讀造成不必要的誤解與紛爭。


圖2 : 本系統核心特色圖
圖2 : 本系統核心特色圖

先前的手語翻譯機皆是使用攝影機與影像處理來辨識使用者的手勢。此類產品最大的缺 點就是無法攜帶,且有嚴苛的使用環境限制:使用者必須在空曠、無生物干擾、足夠大的空 間才能使用產品。除此之外,精準度、使用自然度、以及成本亦不理想,因此手語翻譯機從 未普及於市場。


本發明主要解決的問題和達成的目的有以下二者:其一是增加人機交互的自然性,為了讓使用者便於攜帶,我們的中央控制是結合攜帶方便的行動裝置,使用上並無空間限制,且設計使用上較為輕巧自然,並不需要面對機器做手勢而是可以直接與人面對面,透過行動裝置直接翻譯手勢因而發聲。其二是增加人與人互動的即時性,當面對面作溝通時,手勢偵測裝置除了沒有固定地點的限制外也不會受其他人動作的干擾,具有絕對的準確性,並透過具有語音發聲裝置的行動裝置,讓人在使用手語與他人溝通時,大大增加了互動的即時性。


產品創新與開發能力:

使用彎曲應變計偵測手勢只是創新的第一步,捨棄傳統的影像辨識之後,其實還有很多方法可以偵測手勢。我們曾考慮過將壓力計遍佈於手套上,最後決定使用彎曲應變計,不但較簡單也更加精準。此系統技術上並不困難,正因如此我們可專注於顧客需求與多元化功能的發展。不但不需投入大量資金於硬體發展,更有多元的應用方式等著我們去開發。


質量管理能力:

本產品不需精密的電子儀器,簡單的晶片、電阻、藍牙模組,這些技術都已經很成熟, 可期待高良率、低損壞率,讓使用者能順暢使 用。除了品質優良率高之外,此手語翻譯系統 性價比也很高。此產品成本粗估 5000NTD,假 設定價在萬元左右,此定價也不及助聽器、義 肢等設備的 1/2~1/3。萬元左右的價格,能買到長期說話的能力,已屬輔助設備中性價比非常高的了。


品牌管理與營銷傳播的能力:

此產品形象公益,應能讓大眾對銷售此系統的品牌產生良好印象。由於目前市面上並無手語翻譯相關商品流通,若成為第一個銷售手語翻譯機的廠商,再加上良好的包裝行銷,應能讓大眾印象深刻,一想到手語翻譯便會聯想到該品牌。


供應鏈與銷售管理能力:

此產品貴在概念新穎,並不需要高等的硬體設備、技術等等,因此供應鏈管理應不困難,可期待高銷售利潤。由於目前市面上無人販賣 手語翻譯相關商品,再加上此手語翻譯系統對 喑啞人來說非常方便,未來可望成為喑啞人士 不可或缺的配備,只要持續占有市場,應可帶 來不錯的產品利潤。


工作原理

本作品是高立人老師實驗室自行研究的成果,並已提出專利申請。此作品的理念是結合手勢辨識與發音裝置,達成手語翻譯的目的。為了辨識手勢,我們需要知道每一根手指的彎 曲狀態。可以用二進制 10 位元來表示雙手狀態。


在考慮偵測手指彎曲時,我們曾考慮過使用壓力應變計遍佈於手套的方式。壓力應變計為一種受到壓力便會有阻值變化的可變電阻。將壓力應變計放置於手指關節處,在手指彎曲時,關節處應會承受壓力而產生阻值改變,再進行分壓,將十指彎曲狀態以 0和1表示成10位元的訊號,透過藍牙裝置傳送到語音裝置,判別手勢後進行發音。


然而使用壓力應變計會遇到一個問題,關節位置會因為手指長度而不同。要使應變計位置隨使用者而調整所需花費的成本太大也太複雜,若改成將應變計覆蓋滿手指,所需電阻數量會提高許多,成本亦會升高,且如此一來所得到的電阻資訊會非常複雜,難以處理。


因此我們決定使用彎曲應變計。彎曲應變計是一種長條形的可變電阻,長度剛好約一根手指長。彎曲應變計在感受到彎曲壓力的時候,阻值會產生改變,其壓力值與阻值約呈線性關係。我們在手套的十隻手指上方分別縫上一根彎曲電阻,手指彎曲時電阻值也會改變。 我們在十指後方加上一電路模組,取十指的電 壓分壓,轉換成 10 位元二進制的訊號後,經藍 牙模組傳送至手機。


圖3 : 工作原理之手勢判別對照圖
圖3 : 工作原理之手勢判別對照圖

圖 3 對照圖,其中暫存器 A 之功能為比對 手勢是否與上個 clock cycle 之手勢相同;暫存 器 B 之功能為儲存手勢相等之次數;Flag 表示 暫存器 A 的手勢是否已被儲存。


開始時先設暫存器 A、B、Flag 皆為0,接著開始偵測手套十指上的彎曲應變計之分壓。偵測到的分壓值藉由AD 轉換成為10位元的二進制訊號後,比對是否與暫存器A相等。若不相等,代表此手勢已有別於上一個手勢,使用 者正在進行手勢轉換,需將暫存器 B 之計數歸零,使手勢相等的次數重新計算,且Flag 需重設為0,代表目前手勢還沒有被當成輸出手勢送 出。


若經過 AD 轉換之10 位元訊號與暫存器A中所儲存手勢相等,代表使用者仍維持相同手勢,此時應開始計算此手勢維持時間超過我們 所設定之 n 個 clock cycle;只要取樣結果與暫存器A 之值相等,先將 Flag 設為 0 表示尚未輸出手勢,並將暫存器 B 之值+1,表示手勢又一次相等。接著將暫存器 B之值與n做比對,若B所存之值小於 n,則繼續取樣、比對;若B所存之值大於 n,表示此手勢為欲表達手勢,應將暫存器A的手勢輸出,並將Flag設為1,表示此手勢已經送出,避免在手勢還未改變之時,重新計算此已送出手勢。


手機可內建一資料庫,發送此十位元資訊給資料庫後,回傳一語音資訊給手機,如此便能使手機發出與手勢相對應的語音,達成手語翻譯的目的。


作品結構

在此手語翻譯系統架構中,實作呈現一主端為中央控制模組,及兩從端為手勢偵測模 組,其從端之模組由一彎曲壓力感測單元、一晶片控制單元、及一傳輸單元所組成。如圖 4 為指令執行及傳輸之架構:



圖4 : 系統架構圖(一主端兩從端)
圖4 : 系統架構圖(一主端兩從端)

如下圖之圖5則為從端指令執行及傳輸之單元架構,在從端彎曲壓力感測單元偵測到手部姿勢造成之電阻訊號後,傳至晶片控制單元即可判斷得知手勢,再將其相對應之資訊經由傳輸單元傳至主端之中央控制模組。在從端架構中主控制功能是由晶片控制單元來執行,當遇到了資料輸入量過大而致使系統來不及判斷 及執行指令時,我們處理此問題之方法是採用陣列佇列將不及處理之指令按接收順序將指令暫存,避免指令發生誤判或被覆蓋,並依序處理暫存之指令,使其完整精確執行欲完成之指 令。



圖5 : 從端功能架構圖
圖5 : 從端功能架構圖

圖6 : 從端硬體架構佈線設計之電路零件面圖
圖6 : 從端硬體架構佈線設計之電路零件面圖

圖 6 最右端之佈線設計為將手部姿勢產生之彎曲電阻值與預設之電阻進行分壓,並將取得之數據輸入該圖正中間之微控制器,經由微 控制器判斷手部是否彎曲,如判斷之結果為彎曲,利用微控制器 AD 轉換功能將取得資料進行編碼,將此編碼值經傳輸單元傳至傳至主端 之中央控制模組。



圖7 : 系統功能區塊示意圖
圖7 : 系統功能區塊示意圖

在運作時,如圖 7,彎曲壓力感測單元會因手部姿態快速的變化而大量產生各種需被執行的指令。這時晶片控制單元會去執行這個從感 測單元取得之指令。雖然手語動作觸發的指令都是同樣的,但是會因為比手語者的手勢速度不同,而在同時間取得不同量的資料,為避免 誤判或資料覆蓋之發生,我們採用的是前面有提到的佇列的方式,晶片控制單元執行佇列時 是依據「先進先出(FIFO,First In First Out)」的運算特性來讀取並執行指令;其中陣列佇列的型式我們採用的是環形佇列(Circular queue)。因若只使用單純的陣列佇列,會浪費許多儲存空間,而環形佇列會在佇列存滿之後重 複使用最前面已經使用完畢的位址,這將會使 我們省下較多的儲存空間。最後再將執行完畢之指令及其相對應之資料透過藍牙發射單元傳回中央控制模組之藍牙接收單元結束從端工作。


測試方法

如何測試:

類比數位轉換(ADC)

1.量測彎曲電阻是否電阻值有隨彎曲電 阻彎曲程度而遞增遞減。


2.將彎曲電阻與其 10K 歐姆電阻進行分 壓,電表量測電壓值是否有變化。


3.將其類比電壓值送至 HT66F50 腳位, 設置中斷點,逐步執行觀看電表所量 測電壓值與變數監視視窗中 ADC 變 數值有如正確。例:(電源 3.3v,目前類 比輸入電壓為 1.5v,則 ADC 變數值約 為 1862)


4.在兩隻手上各搭載 HT66F50 晶片,分 別將五根手指類比電壓輸入晶片進行 ADC 轉換。


UART藍牙傳送

1.我們使用藍牙模組 HC-05 進行資料傳輸,將藍牙模組利用電腦超級終端機下達 AT 指令,將其兩個藍牙模組更改為從機(slave)模式。


2.利用超級終端機下達 AT 指令,使其藍牙模組鮑率為 9600bit/s


3.利用超級終端機下達 AT 指令,設置藍牙連 線密碼。


4.將藍牙與 HT66F50 晶片連接,傳送預設字 元 ABC,超級終端機上亦顯示 ABC,則表示藍牙傳送端程式及硬體電路無誤。


測試條件:

測試環境:需使用 e-ICE 測試彎曲電阻、藍牙。


測試結果:

彎曲電阻、藍牙模組在 66F50 下正常操控 使用。並將其彎曲電阻之分壓值經由藍牙傳輸,超級終端機顯示其數值無誤。手機再與藍牙連接將其兩隻手勢編碼進行判讀、發出其對應之語音文字。


(本文作者高立人為台北科技大學電子工程系教授,蘇宛琳、余佩儒、魏新展、劉俊成為台北科技大學電子工程系研究生)


參考文獻

[1]盛群半導體股份有限公司 HT66F50 DataSheet


[2]微控科技 HC-05 藍牙模組


[3]SPARKFUN 彎曲電阻


[4]中華民國啟聰協會 http://isign.deaf.org.tw/iSignHome.asp


相關文章
一美元的TinyML感測器開發板
用科技滅火:前線急救人員的生命徵象與環境監測
221e:從AI驅動感測器模組Muse獲得的啟發
利用微小型溫濕度感測器精準收集資料
以霍爾效應電流感測器創新簡化高電壓感測
相關討論
  相關新聞
» 日本SEMICON JAPAN登場 台日專家跨國分享半導體與AI應用
» MONAI獲西門子醫療導入應用 加快部署臨床醫療影像AI
» 巴斯夫與Fraunhofer研究所共慶 合作研發半導體產業創新方案10年
» 工研院IEK眺望2025:半導體受AI終端驅動產值達6兆元
» ASM攜手清大設計半導體製程模擬實驗 亮相國科會「科普環島列車」


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.191.26.149
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw