帳號:
密碼:
最新動態
產業快訊
CTIMES / 文章 /
數位音頻介面標準與量測 (一)
數位音頻介面標準(AES3 and IEC60958)

【作者: 陳建誠】   2002年02月05日 星期二

瀏覽人次:【5829】

早在80年代,藉由CD player等產品的出現,開始朝向數位音頻的發展。在早期的作法是把數位訊號停留在一個內部單位,並且轉換成類比訊號之後送到下一單位使用。現在較新的趨勢是盡可能保留訊號在數位領域(digital domain),也只有這樣才能避免訊號不斷被轉換,進而保持訊號本身品質。


兩大公認標準

為了要使不同裝置能夠在數位領域間溝通,數位音頻介面是不可缺少的,目前有許多數位音頻介面應用在不同的的領域上,其中最被大家所公認的世界音頻標準為:AES3與IEC60958-4,AES3一般都稱為專業性標準,而IEC60958-3則稱為消費性標準。


專業性與消費性這兩種標準間有些許的差異,而這些差異會使得兩者互不相容。嚴格來說,專業性與消費性這兩種界面是不應該被混合在一起。但事實上,兩者極為相似,在很多情形下,接上正確的電源後,被嵌入在訊號中的音頻訊號,是很容易的從一個標準傳達到另一個標準。


相容性的產生

相容性是指儀器內的相互聯繫,不會因規格有所不同而造成性能或機能的降低。為了達到這些標準的一致性,數位音頻儀器的使用者,應該預料到其中的相容性問題。


一般而言,數位音頻界面應傳達三種訊息:


1. 時間


2. 音頻資料


3. 非音頻資料


其中一些訊息可能會因為符合界面要求而改變或減少其音頻訊號。我們需就界面的習性與性能方面去考慮,例如一個接收器能承受多少訊號抖動(incoming jitter)或是一個範圍很寬的Frame rate以及一個發送器能否同時性地一直維持其精確性。接下來我們就來談談數位介面的介面格式。


Bi-phase編碼

在還沒使用Bi-phase編碼前,PCM ( pulse code modulation )音頻訊號很難確實地被傳送與接收。舉例來說,假設在一段時間內,所傳送的訊號像DC訊號,即所有的bits全部是1(或是0),為了要正確地傳遞這訊號,與界面相關聯的電路必須是可以通過DC的。如果是傳遞一個 「數位DC」訊號,clock速率可以說是沒有或很少變化,那麼一個分離式的同步連接器是不可或缺的。


應用方式

為了處理這些界面的問題,數位資料便改成Bi-phase編碼方式。其優點在於:若界面訊號中間,資料為一大串零時,也沒有所謂的DC效應,這樣就可以將訊號做AC-coupled通過變壓器或是通過一連串的電容器。


Bi-phase編碼的運作模式為:每一個data bit有一個time slot(圖一),而這個time slot開始時會對前一state做轉換動作,並且結束於下一個轉換,而這也是下個time slot的開始。


假設這個data bit是一個 "1",在這個time slot中間加入了轉態;而在下一個data "0"時,卻不會因此也在中間加轉態。這意思是就算一個有data 0的數位DC訊號,在每個time slot還是有轉態。這個計時器還是維持很規律的轉調,這時界面的訊號明顯地表現為AC,而轉調的方向(或訊號兩極性)會變為互不相關。這種編碼的組合使得接收器在接收資料時,可以很容易的重新建立取樣頻率。



《圖一 Bi-phase編碼的運作模式》
《圖一 Bi-phase編碼的運作模式》

由上面敘述得知,Bi-phase編碼方式可歸納如下(圖二):


1.每一筆資料編碼方式是由2個UI組成。


2.第一個UI:目前資料和前一筆資料相反。


3.第二個UI:若資料為1時,與第1個 UI 資料相反。


若資料為0時,與第1個 UI 資料相同。


《圖二 Bi-phase編碼方式》
《圖二 Bi-phase編碼方式》

因此當一資料呈現有轉態時,資料為1。


當資料為轉態時,資料為0。


Bi-phase coding 的優點

Bi-phase coding 在轉輸上的優點如下:


1.不會有連續2個以上的1出現,故傳輸時的接收端很容易判讀接收訊號是否正確。


2.DC成分很少,即不會有一連串1或0的資料出現在同一個Frame,缺少DC意味著當訊號經一長距離傳輸時,訊號振幅會因Cable阻抗衰減,剩下的訊號仍是對稱均勻,以致於訊號也能很容易被正確判讀出來。


3. 由於Bi-phase coding對極性不靈敏,即使對信號作反相也無影響,故對於接收端的界面影響不大。


Unit interval (單位區間)

量測界面的時間參數很多,通常使用的量測單位為單位區間(Unit interval)簡稱為UI,這是介於轉態間最短的間隔。Bi-phase編碼採用一個bit兩次轉態的編碼原則(data "1"),這表示一個time slot被限定寬為2 UI。例如在一個Frame中有64bits,則會有128個UI。通常在數位領域中,Delay和Jitter通常都用UI表示多於nanoseconds,因為UI和Sample rate有密切的關係。


較不易分析抖動和延遲

在48KHz的取樣頻率下,一個UI大約是162.7ns。相對的,在44.1KHz的取樣頻率下,一個UI約177ns。所以UI和取樣頻率的關係是相對的,在分析Jitter和Delay時,使用UI較容易表現出訊號的失真現像。


Frame (框架)

界面的資料傳送是連續性的,為了識別各種不同位元的資料,資料流就被分成64 time slot (或是128UI) 的Frame。由於time slots與data bits是一樣的,所以1個Frame經常是被說成64 bits。


每個Frame中包含了兩個Sub-frame,可以用來傳送兩個資料的通訊管道,例如Channel 1資料放在Sub-frame1,而Channel 2資料放在Sub-frame2。(圖三)為一個Frame,其中含有64個time slots (數字0到63),一個Frame長為128UI。



《圖三 一個Frame的架構》
《圖三 一個Frame的架構》

每個Sub-frame的前4個time slots傳送前導訊號,而這也記錄了Sub-frame的開始與識別Sub-frame的型態。接下來的24個time slots是傳送音頻資料,從LSB(least significant bit)開始傳送,一共傳送24個位元。而最後4個time slots是傳送:有效位元、使用者位元、通道狀態位元、以及同位元。


Preambles(前導訊號)

前導訊號是一個特殊的資料型態,傳送Sub-frame中最先的4個time slots,除了Sub-frame外,還記錄了每段的開始。一共有三種前導訊號,藉由持續3UI所產生一個或兩個脈波,來中斷雙階段編碼規則 (Bi-phase Coding Rule);而中斷規則的意思是這種型態不可能發生在任何資料內。


為了區分每資料段(Block)的開始,在每192個Frame中,Sub-frame1則是開始在一個X 前導訊號,Sub-frame2總是開始於一個Y 前導訊號,若此Frame為資料段的起始Frame,則Sub-frame1中的X 前導訊號,將被Z 前導訊號所取代。


由於傳送的界面訊號可有效地反應出一般或被轉化兩極性,前導訊號可被視為一個負緣轉態的開始(圖四)或正緣轉態的開始(圖五)。


《圖四 負緣轉態開始的前導訊號》
《圖四 負緣轉態開始的前導訊號》
《圖五 正緣轉態開始的前導訊號》
《圖五 正緣轉態開始的前導訊號》

在Bi-phase編碼規則中,在每個time slot間都有個轉態,但是只有在前導訊號例外,因為在前導訊號中有兩個time slots,是沒有任何轉態。這些違反Bi-phase編碼是在time slot 0之後,每個前導訊號是在同個地方,這是為了確認一個新的Sub-frame已經開始,而接下來的位元也確認了是哪種Sub-frame。


圖三中SYNC位元數就是圖四與圖五中的訊號位置。這些前導訊號寬有8UI,所以在相同的時間內是相當於4個位元。這三種前導訊號連續三個UI保持在相同的準位,這情形是不可能在其他音頻資料或是輔助資料中發生。這三個單位UI的長脈衝呈現一個低頻的部分相對於整個串列資料,所以他們是最不受cable attenuation和cable induced jitter影響,所以我們常利用前導訊號來量測IC內部clock jitter。


Audio data (音頻資料)

在前導訊號後,音頻資料的LSB被先傳送出來,對音頻訊號來說,當音頻資料少於24位元時,調整資料的最高位元放置在MSB地方,剩餘的bits全部補0。如(圖六)所示。


《圖六 音頻資料的傳送模式》
《圖六 音頻資料的傳送模式》

輔助音頻資料

有一些音頻訊號,只傳送20位元或少於主要的音頻資料,所以利用前導訊號之後的前四個位元來當另一種訊號,而這訊號即為輔助音頻資料(auxiliary audio data)。如(圖七)所示,如果這輔助音頻資料被採用,通道狀態(Channel State)將表示出最高的字長為20位元,decoder會特別處理這輔助音頻訊號,使得任何訊號資料都無法加進主要的音頻資料中。可惜的是很多decoder都無法處理這輔助音頻資料。


《圖七 通道狀態將表示出最高的字長》
《圖七 通道狀態將表示出最高的字長》

輔助音頻訊號的使用機會很少,其中一種是應用在聲音通訊方面,如AES3建議將輔助位元用來作bits調整的功用。例如:使用輔助音頻訊號來放置音頻訊號的壓縮資料,也是一種可行的方式。


Validity bit (有效位元)

有效位元本來就是用某種方式來證明傳遞資料的正確性;如果這位元為1,可以被確認的是,資料在轉換過程中,資料出現問題。所以有一些應用上的作法為:若發現有資料有錯誤時,有效位元就設定為1,並把資料隱藏起來。這種應用對CD players來說,相當普遍。


當一個訊號被標記成無效時,一個接收端決定應該如何去表現,這種困惑對這位有效的位元的功能性來說,並不是一件很容易的事。當使用IEC60958或是AES3格式來傳送資料時,若PCM音頻訊號無法很流暢時,這位元應被設定為1。這樣就有機會讓播放器的輸出變成為無聲,若能試圖將正確的音頻資料再重現,這麼做會更好。


防止噪音或爆音

對於在傳遞AES3或是IEC60958壓縮資料音頻方面,這位元需要被設定為1,這麼一來linear PCM接收器就可以辨識出何時必須要無聲。這潛在的優點是在Channel State模式中,在讀取非音頻(non-audio)位元時,可以確認這訊號不是linear PCM音頻,進而去阻止接收器從這資料中產生高度噪音或爆音。


User bit (使用者位元)

使用者位元可被用來傳輸使用者特殊的資訊,即消費性設備的特殊應用資訊,例如CD或是DCC。在消費性的規格方面,IEC60958-3已經定義在資料流中傳送分組格式資訊,且為了保護使用者資料,限定在使用不同種類儀器時的規則,如(圖八)所示。



《圖八 使用者位元層級與應用範圍》
《圖八 使用者位元層級與應用範圍》

在消費性格式中,資料流中的Sub-frame1與Sub-frame2相結合,而形成一組為2 bits/Frame的型態。這表示在一個44.1 kHz的Frame速率中,資料速率為88200 bits/sec,此即所謂的使用者資料流(user-data stream)。


專業規格可容納的資料

對AES3與IEC60958-4專業規格來說,已經有Channel State資料,所以可以容許不同格式當使用者資料(user-data),如:


1. 每個資料段中,有192 bits當Channel State


2. AES18 (packet based)


3. IEC60958-3使用者資料的格式


對專業格式來說(除了IEC60958-3使用者資料格式外),使用者資料流(user-data stream)是由Sub-frame1與Sub-frame2中的user bit所組成。因此,共有兩組資料流,每組有1 bit/Frame。在理論上,可以結合兩個使用者資料流其速率為2 bits/Frame,當作兩個Sub-frame傳送同一個Channel。不過到目前為止,專業性格式的應用較少人採取使用者資料(user-data)。


Channel Status bit (通道狀態位元)

在一被傳送的資料段(block)中,Channel State共有192位元,其Frame是開始於前導訊號 "Z",這視為這資料段的第一位元,而這個Z 前導訊號有時被稱為 "block start"。每個Sub-frame1與Sub-frame2都有獨立的Channel State位元,所以經常是有兩組資料段(block)。常常這兩組資料段還傳送同一個資料,所以有很多接收器只檢測其中一個Sub-frame的資料。


如(圖九)為消費性格式的Channel State欄位、(圖十)為消費性格式的Channel State欄位解釋,(圖十一)為專業性格式的Channel State欄位,從這些圖中得知,兩者資料段內容解釋差異很大。



《圖九 消費性格式的Channel State欄位》
《圖九 消費性格式的Channel State欄位》

《圖十 消費性格式的Channel State欄位解釋》
《圖十 消費性格式的Channel State欄位解釋》

《圖十一 專業性格式的Channel State欄位》
《圖十一 專業性格式的Channel State欄位》

Channel State位元干擾

有些Channel State位元還會影響儀器處理音頻資料:特別是在non-audio和emphasis的領域中,對詮釋資料的方式,有著重大不相同處。


以"non-audio"來說,如果non-audio位元被設定為1時,音頻資料就不適合當linear PCM解碼資料。


當音頻訊號是使用在壓縮資料格式時,例如MPEG、DTS以及Dolby AC-3,這些都是"non-audio",若把它們的音頻資料,直接當成是linear PCM並不恰當,而且還會造成高度的噪音。傳遞這些壓縮資料形式的標準為:以消費性應用方面,標準是IEC61937,而SMPTE337M就是對專業性方面的應用標準。


以"emphasis"來說,如果emphasis領域表示這訊號已經加強,那de-emphasis應該被應用在任何數位到類比的轉換。在消費性格式中,只有CD 格式才有支援emphasis;在零點與極點中,它具有一個高頻提升與50ms及15ms的時間常數。專業形式支持這個形式的有:J-17 emphasis,它的時間常數差不多為333ms及38.5ms。


就消費性與專業性形式來說,這些資料段裡位元的意義所解釋都不同。


Parity bit (同位元)

同位元是用來維持資料的偶數相同,作為錯誤檢查。特別的是在界面訊號中,偶數相同是表示在資料time slots 4 to 31中,共有偶數個中間層的轉態(即為1的意思)。


偶同位

偶同位對每個Sub-frame開始與在同方向的轉態有影響。因此,一個AES3或是IEC60958傳送器並不需要去計算同位元。由於在Sub-frame中,同位元是最後的位元,所以接收端只需要核對第二個Sub-frame的同位元狀態,因為它總是與先前的Sub-frame的狀態相同。


Bi-phase編碼資料若被干擾是可被查出,因為在消失不見的轉態中,至少有一個會在time slot的邊界上。比起使用同等位元,檢查Bi-phase編碼的干擾,可以更有幫助的來確認錯誤。


結論

在迅速崛起的IA時代中,數位音頻傳輸介面已經是一大家公認的標準,在目前IA設備中,數位音頻傳輸介面是不可或缺的,數位訊號規格幾乎都必須符合IEC60958或AES3規範,所以在數位音頻訊號領域,如DVD、VCD、CD、音效卡、甚至合成數位視訊,涉及內部資料傳送的工作者,瞭解IEC60958以及AES3規範是必要的。


相關文章
三波長堆疊雷射二極體設計
藍光DVD與HD-DVD發展動向
可錄式DVD用高功率紅光雷射最新技術動向
綜觀DVD晶片產業發展趨勢
剖析DVD新儲存規格技術發展趨勢
相關討論
  相關新聞
» Rohde & Schwarz 行動通訊測試高峰會聚焦無線通訊最新發展 – 現已提供線上回放
» Rohde & Schwarz 與 ETS-Lindgren 合作提供下一代無線技術的 OTA 測試解決方案
» 筑波醫電攜手新光醫院於台灣醫療科技展展示成果
» Anritsu Tech Forum 2024 揭開無線與高速技術的未來視界
» 安立知獲得GCF認證 支援LTE和5G下一代eCall測試用例


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.227.140.152
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw