帳號:
密碼:
最新動態
產業快訊
CTIMES / 文章 /
智慧型手機的音訊設計議題
 

【作者: 歐敏銓】   2006年03月01日 星期三

瀏覽人次:【12233】

當手機不斷地整合包括照相、遊戲、數據資料、視訊等各種功能於一身時,它已搖身一變為一台多媒體應用的播放平台,可說是朝具體而微的隨身型迷你電腦在發展。定位上,這樣的手機有別於既有的純粹語音的手機(Voice phone)或具備某些功能的手機(Feature phone),而當屬於智慧型手機(Smart phone)。


智慧型手機除了具有較強的資料編輯管理能力,更能提供音、視訊、遊戲的多媒體應用服務,也能同時處理多項工作。更進一步來看,它的功能面涵蓋了通訊、資訊與多媒體功能,即:


  • ●通訊功能:語音、訊息(messaging)、認證(Authentication)、計費(Billing)等等通訊處理功能;


  • ●資訊功能:Email、行事曆、資訊管理、Sync、安全性等資訊處理功能;


  • ●多媒體功能:視訊、照相、遊戲、TV、串流、音樂、DRM等多媒體應用功能。



除了資訊功能外,在通訊與多媒體的應用上,音訊是必要的處理任務。在過去,手機只需要處理單純的語音通話訊號,但今日的智慧型手機中得處理的音訊任務繁重,除了多音調振鈴、MP3音樂外,可能還要有FM廣播及遊戲音效,而且不能只是單聲道的效果,現在要求的是立體聲的臨場感體驗。


過去,數位音訊的世界是截然兩分的:一邊是Hi-Fi的世界,另一邊則是語音的世界。一般而言,Hi-Fi是指16-bit立體聲品質、以44.1kHz取樣的音訊,也就是CD音樂的規格;電話語音則是8-bit和8kHz的單聲道(mono)、低階品質音訊。不過,進入智慧型手機的時代,兩個音訊世界開始撞擊在一起了,如何將音訊次系統完善地與應用及通訊處理平台整合在一塊,就成了行動設備工程師開發新產品時的關鍵性挑戰。


音訊編碼格式與介面

在進入系統架構的探討前,先來看看音訊編碼的現狀。今日音訊編碼的格式繁多,針對聲音的編碼就有PCM、ADPCM、DM、PWM、WMA、OGG、AMR、ACC、MP3Pro以及MP3等;針對人類語音有LPC、CELP與ACELP等;其他還有MPEG-2、MPEG-4、H.264、VC-1等視聽節目的編碼格式。手機多媒體格式的市場趨勢請參考(圖一)。


《圖一 手機多媒體格式的應用市場趨勢》
《圖一 手機多媒體格式的應用市場趨勢》

以下介紹三種常用的音訊格式:


AMR格式

AMR為自適應多碼率語音傳輸編解碼器(Adpative Multi-Rate Speech Codec),最初版是歐洲電信標準化拹會(ETSI)為GMS系統所制定的語音編解碼標準,而因頻寬又分為兩種--AMR-NB(AMR Narrowband)和AMR-WB(AMR Wideband)。以市場最大品牌Nokia來說,其多數手機都支持上述兩種格式的音訊檔。


MP3格式

MP3是MPEG AudioLayer3的縮寫,這是一種音訊壓縮技術,其編碼具有10:1~12:1的高壓縮率,可以保持低頻部份不失真,但犧牲了音頻中12KHz~16KHz的高頻部份來降低檔案大小,其.mp3格式檔案一般只有.wav檔的10%。另外,MP3受到歡迎的一大原因,是它並非受到版權保護的技術,所以任何人都可以使用。


MP3格式壓縮音樂的取樣頻率有很多種,可以用64kbps或更低的編碼來節省空間,亦可以用到320kbps以達極高的壓縮音質。MP3在編碼速率上,又分為CBR(固定編碼)以及VBR(可變碼率)技術,有些手機無法播放下載來的音樂,正是因為沒有支援VBR格式的MP3音樂。


AAC格式

AAC即高級音頻編碼(AdvancedAudioCoding),它採用的運算方式是與MP3不同,AAC可以同時支援多達48個音軌、15個低頻音軌、更多種取樣率和傳輸率、具有多種言語的相容能力,以及更高的解碼效率。總結來說,AAC可以在比MP3檔案再縮小30%的條件下提供更好的音質,所以被手機界視為是最佳的音訊編碼格式。AAC是一個大家族,他們是共分為九種規格,以適應不同場合的需要:


  • ●MPEG-2AAC LC 低複雜度規格(Low Complexity);


  • ●MPEG-2 AAC Main主規格;


  • ●MPEG-2 AAC SSR可變取樣率規格(Scaleable Sample Rate);


  • ●MPEG-4 AAC LC低複雜度規格(LowComplexity),現在的手機比較常見的MP4檔中的音頻部份就包括了該規格音頻檔;


  • ●MPEG-4AAC Main 主規格;


  • ●MPEG-4 AAC SSR 可變取樣率規格(Scaleable Sample Rate);


  • ●MPEG-4 AAC LTP長時期預測規格(Long Term Predicition);


  • ●MPEG-4 AAC LD低延遲規格(Low Delay);


  • ●MPEG-4 AAC HE高效率規格(High Efficiency)。



上述的規格中,主規格(Main)包含了增益控制以外的全部功能,其音質是最好,而低複雜度規格(LC)則是比較簡單,沒有了增益控制,但提高了編碼效率,至於SSR與LC規格大致相同,但是多了增益的控制功能,另外,LTP/LD/HE都是用在低碼率下的編碼,其中HE採用NeroACC編碼器支援,是近來常用的一種編碼率方式。不過一般來說,Main規格和LC規格的音質相差不大,因此考慮手機目前的記憶體仍有限的情況下,目前使用最多的AAC規格是LC規格。


音訊介面

就音訊的介面來說,也是智慧型手機設計者需考慮的重要議題。數位語音一般採用PCM(Pulse Code Modulation)介面,而Hi-Fi立體聲則採用串列I2S(Inter-IC Sound)介面或AC '97介面。I2S是飛利浦為數位音訊設備之間的音訊資料傳輸而制定的一種匯流排標準,是目前消費性音訊產品中常用的介面;AC '97則是英特爾用於提升個人電腦音效、降低噪音的規格,由於在1997年制訂,因此稱為AC '97。


在電腦的音訊需求上,基本上與消費性市場極相似,但為了要能播放不同取樣速率(8kHz、44.1kHz、48kHz)下錄音的音樂檔案,所以需要更有效率和便宜的解決方案,而AC '97就具有這樣的特性。在廣義的手持式設備市場中,三種格式各有其擁護者:CD、MD、MP3隨身聽會採用I2S介面;行動電話會採用PCM介面;具音訊功能的PDA則使用和PC一樣的AC '97編碼格式。


音訊系統整合策略

在較早的整合系統中,通常是將電話與PDA的電路並排放在這個設備外殼內,其中PCM語音編解碼由通訊處理器來控制,Hi-Fi立體聲(AC '97或I2S)的處理則連到另一顆應用處理器。在此架構中,兩個音訊子系統之間的整合性還很低,分散式的硬體切換電路除了較占空間、需要額外的離散元件來做訊號交換和混音外,也會帶來諧波失真(harmonic distortion)等的問題,如(圖二)所示。



《圖二 PCM與立體聲分別處理的音訊架構》
《圖二 PCM與立體聲分別處理的音訊架構》

因此,為特定應用而量身定製一套整合性的解決方案是較理想的作法。在SoC的技術趨勢下,已有一些廠商將立體聲數位類比轉換器(DAC)或編解碼器(CODEC)整合到特定功能的IC當中。不過,有些功能適合整合在一起,有些則可能得到反效果。


舉例來說,當廠商將電源管理和音訊處理功能整合在一起時,通常得在音質的部分做妥協,因為電源穩壓器(regulator)所產生的噪訊會干擾到附近的音訊路徑;若將音訊功能整合到數位IC中也有困難,因為對於Hi-Fi的元件來說,需要用到0.35μm的製程來讓混合訊號處理得到最佳化效能,但目前數位邏輯方面的應用已朝採用0.18μm以下的更高階製程發展。以上述兩種整合性的晶片策略來說,要讓兩種不同的電路同時存在於一個晶片當中,其最終的晶片尺寸可能也會大到難以接受。


此外,揚聲器功率放大機(loudspeaker amplifier)特別難被整合。它所產生的熱是一個問題,需要做散熱處理,因此往往需要另一顆獨立的揚聲器驅動IC。還有一個整合上的常見問題,也就是為了讓IC盡量做到最小化,可能會產生類比輸入或輸出接腳數目不足的問題。


專屬的音訊IC可避免這些問題,而音訊整合有好幾種方法可以達成。共享ADC和DAC能減少硬體成本,但卻不能同時播放或錄製兩種音訊流格式。為個別功能安排專屬的轉換器(converter)可以解決這個問題,不過,此一作法會增加晶片成本。妥協的作法是只共享ADC的部分,但有獨立的DAC,這樣做的話,當電話通訊在進行時,也可以同時播放其他音訊(如播放另一通電話的鈴聲,或播放音樂),但在通訊時不能同時進行錄音。ADC的耗電可以透過關掉一種用途,而以較低取樣速率的方式來加以控制。請參考(圖三)及(圖四)。


《圖三 專屬音訊處理系統概念》
《圖三 專屬音訊處理系統概念》

《圖四 智慧型手機音訊處理架構圖》
《圖四 智慧型手機音訊處理架構圖》

此外,音訊系統也可以有不同的作法。當語音CODEC被整合在通訊晶片組中時,搭配另一顆具有額外類比輸入、輸出和內部混音的Hi-Fi CODEC是恰當的作法;在另一種情況下,一個具有直接連結無線耳機功能(如藍芽)的專屬PCM介面的雙CODEC也有其使用上的好處,如(圖五)所示。


《圖五 具有無線耳機功能(如藍芽)的雙CODEC音訊架構》
《圖五 具有無線耳機功能(如藍芽)的雙CODEC音訊架構》

以下針對音訊系統中的幾個重要組成進行規劃上的分析:


時脈與介面

共享通訊與應用次系統的內部電路區塊雖然可行,但對於介面來說並非如此,因為不同的音訊應用得在獨立的時脈區域中以自己的時脈頻率來運作。只要情況仍是如此,整合性智慧型手機的CODEC就需要同時有PCM介面和獨立的I2S或AC '97連結介面。


在非移動性的設備(如PC)中,音訊時脈通常由一個石英振盪器(crystal oscillator)來產生,但在智慧型手機的設計中,為了避免額外的耗電、板面空間和時脈晶片的成本,設計者偏向於將Hi-Fi音訊所需的時脈功能從既有的時脈中獨立出來。由於低耗電、低噪訊的鎖相迴路(PLL)能被以相對較低成本整合到混合訊號晶片當中,所以元件廠商的作法是將一顆或兩顆PLL整合到智慧型手機CODEC中。


麥克風

在智慧型手機中最難的設計議題,往往與麥克風(Mic)有關。一般來說至少有兩個麥克風需要考慮:一是內建的內部麥克風和插入耳機(headset)的外部麥克風。此外,可能還會有用於噪訊消除(noise cancellation)或立體聲錄音的額外內部麥克風,以及車用免手持功能所需要的另一個外部麥克風。除了講電話外,這些麥克風也能透過應用處理器的控制來錄製語音短訊或視訊短片中的音效。


若要由音訊CODEC晶片來涵蓋各種切換功能,此晶片的電路需要做好妥善的設計。除了錄音功能,CODEC也應提供側音(side tone)的功能,這樣一來耳機用戶也能聽到自己的聲音。插入偵測功能則能提供無縫的切換功能,也就是當耳機插入或拔出時,系統會自動轉換使用內部或外部的耳機。


人聲(acoustic)的噪訊消除是另一個問題,它需要用到兩個麥克風,一個同時接收講話的聲音和背景噪訊,另一個則只接收背景噪訊。類比的作法往往不足夠,因此需要透過數位訊號處理來加強,而音訊CODEC需達成兩個麥克風訊號的數位化任務。


另一個問題是室外風聲噪訊的問題,它的頻率通常低於200Hz,因此透過高通(high-pass)濾波器就能處理掉,但這樣一來,在室內錄音時就少了低頻部分的聲音。對於兩用的麥克風來說,這個過濾器應該是可選用的,但很多的音訊ADC中都已內建了這顆high-pass濾波器,因此,手機廠商應針對需求選擇合用的解決方案。


外接耳機

手機外接耳機(headset/headphone)的使用也需要特殊的類比電路,也就是當耳機插入時,音訊輸出訊號就能繞徑到耳機上頭。雖然整合機械性開關的插座(socket)能夠滿足此要求,但它的尺寸過大且昂貴;此外,揚聲器的音量大小可能也不適合這個耳機。為內部與外部音訊提供獨立的音量控制可以解決此問題,而且也能使用較簡單的插座設計。此一外接耳機是否具有麥克風也需要被偵測出來,這可以透過是否感測到重疊電流(bias current)來分辨,如果沒有電流流動,那就表示沒有麥克風被插入。智慧型手機的音訊CODEC中應加入此一電流感測器,進而能因應不同情況達成音訊輸出入的處理。


揚聲器

智慧型電話在先後增加了多音調振鈴、MP3播放及FM廣播等功能後,其播音系統也朝向立體聲揚聲器來發展。在手機揚聲器的設計上,主要的問題是配置架構、功率與耗電性的考量。若要支援立體聲,手機需要有兩個外部揚聲器,但由於手機體積太小,這兩個揚聲器的位置難以拉開,所以立體聲的效果不易展現,這時就需要採用特殊的3D效果處理。若是要支援免持聽筒的功能,那就需要連結到另一個較大的揚聲器上。為個別揚聲器提供專屬的類比輸出是最好的方式,但電源管理上必須有因應作法。


由於揚聲器功率放大機會用掉大量的供電,當它們不使用時關掉電源是很重要的。智慧型手機的音訊CODEC能提供一些電源管理功能,為個別揚聲器的輸出做好開關管理,這樣一來能避免不需要的電源洩露。此外,系統電源管理方案中的電壓穩壓器通常無法為揚聲器提供達到最大音量所需的電力,因此CODEC晶片廠商採用加入晶片內揚聲器放大機的作法,也就是直接透過電池來驅動揚聲器。這樣做雖然不見得能降低耗電,但它也省下了對額外電壓穩壓器的需求。


鈴聲


近幾年來,手機鈴聲愈來愈複雜,從單純的響鈴聲,到和絃鈴聲,再到各種聲音都能製作成立體聲的WAV和MP3格式。MIDI已成了和絃鈴聲的標準格式,很多廠商為此一應用推出專屬的低耗電MIDI晶片。要在音訊次系統中整合此一 MIDI晶片,CODEC上需要有額外的類比輸入。


這些額外的輸入對於FM收音機IC的連結也是有用的,能為多媒體應用提供加值的功能。MIDI音訊的產生當然也能由音訊CODEC來產生,但現今市場的趨勢是以特殊的鈴聲檔案來儲存,並透過現存的Hi-Fi DAC來播放,在此一市場區隔的情況下,欠缺MIDI軟體庫的CODEC晶片廠商並不會積極去做這件事情。


結論

智慧型手機的下一步會是如何?就Hi-Fi的立體聲來說,儼然已是必備的系統功能,至於I2S與AC '97在手機音訊系統上的競爭仍然會繼續下去。有些人喜歡較單純的I2S介面,但也有人更中意低pin腳數和很容易可跑不同取樣速率的AC '97。以智慧型手機來說,目前多數低耗電的處理器對兩種規格都支援,看來兩者還是會並存下去。不過,對於CODEC的廠商來說,要同時支援兩項規格是比較困難的,因為AC '97的VRA(variable rate audio)功能需要和I2S不同的時脈架構,也需要多出許多額外的數位電路才能做到。


不過,智慧型手機還會不會如PC世界一樣,從從立體聲走向多聲道的環繞音效格式(Intel的Azalia)呢?在近期內還看不出這樣的可能性,因為今日的多聲道效果雖然很炫,但晶片的成本和耗電性都還太高,這不是手機世界所能接受的。但今日否定的答案,在未來的電子世界仍存在很大的變數,沒有人能說得準的。


延 伸 閱 讀
未來智慧手機的電源管理技術

Polycom宣佈,國際電信聯盟(ITU)已批准Polycom Siren 14技術為14kHz超寬頻音訊編碼新標準。同時將進入由ITU-T建議的G.722.1 Annex C標準的最後徵求意見(Last Call)階段。該技術現正以免版權費(royalty-free)方式提供授權,可提供接近CD音質的音訊品質,不但聲音更清晰,且減少了用戶因視訊會議所帶來的聽覺疲累。相關介紹請見「Siren14音訊技術成國際標準」一文。

iPod熱賣持續發燒,台灣MP3晶片設計廠商亦期望能趕上這個風潮。目前來說,台灣投入MP3晶片的廠商包含凌陽、聯陽、揚智與合邦等廠商。至於在2005年的表現,根據初步估計約不到5%的市場佔有率,可見得台灣IC設計廠商仍舊有很大的發揮的空間,尤其是MP3晶片報價已被壓到2美元以下。你可在「MP3晶片是台灣IC設計廠商可發揮的空間」一文中得到進一步的介紹。

音效晶片不管在DVD、音響或是電腦上,都是不可或缺的一個部分,因為它掌管了音訊的輸出品質。一套很棒的軟體或音響喇叭,若缺少了音效晶片的計算控制,聽起來就會讓人覺得索然無味。在「讓PC成為家庭劇院」一文為你做了相關的評析。

市場動態

瑞昱半導體(Realtek)發表新一代HD音效晶片ALC882。該新晶片具有高音質、多音源獨立輸出入技術、全新杜比高效能立體環繞音效功能等優勢特點,在新一代數位家庭(Digital Home)的個人電腦平台應用上,將提供多聲道、高音質音效的完整解決方案。相關介紹請見「瑞昱發表新一代HD音效晶片ALC882」一文。

英特爾發表適用於電腦的新一代PC音頻格式High Definition Audio(HAD)。HDA是產品代號名為Azalia的音頻格式,現今版本為0.9。Intel計劃公開其最終版本。同時,英特爾將於2004年上半年推出支援HDA的電腦專用chip set(晶片組)Grantsdale。你可在「Intel下一代音頻格式HDA將出爐 取代WMA?」一文中得到進一步的介紹。

MP3數位音樂風潮方興未艾,看好MP3、WMA(微軟特有的音樂壓縮格式)音效晶片市場擴增可期,多家IC設計業者紛紛投入開發工作,希望或多或少搶佔一杯羹。在「IC設計 搶攻MP3、WMA音效晶片市場」一文為你做了相關的評析。

  相關新聞
» 日本SEMICON JAPAN登場 台日專家跨國分享半導體與AI應用
» Nordic Thingy:91 X平臺簡化蜂巢式物聯網和Wi-Fi定位應用的原型開發
» 豪威集團推出用於存在檢測、人臉辨識和常開功能的超小尺寸感測器
» ST推廣智慧感測器與碳化矽發展 強化於AI與能源應用價值
» ST:AI兩大挑戰在於耗能及部署便利性 兩者直接影響AI普及速度


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.119.117.77
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw