CTIMES- 數位音頻介面標準與量測 (一) :CD player,incoming jitter,DVD,VCD,音效卡,LSB,其他儀器設備

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

解析2025產業趨勢：MIC所長 x CTIMES編輯

【文章精選】鍺：綠色回收與半導體科技的新未來

。【東西講座】11/29 智慧製造與資訊安全

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES / 文章 /

數位音頻介面標準與量測 (一)

數位音頻介面標準(AES3 and IEC60958)

【作者：陳建誠】 2002年02月05日星期二

瀏覽人次：【5752】

早在80年代，藉由CD player等產品的出現，開始朝向數位音頻的發展。在早期的作法是把數位訊號停留在一個內部單位，並且轉換成類比訊號之後送到下一單位使用。現在較新的趨勢是盡可能保留訊號在數位領域(digital domain)，也只有這樣才能避免訊號不斷被轉換，進而保持訊號本身品質。

兩大公認標準

為了要使不同裝置能夠在數位領域間溝通，數位音頻介面是不可缺少的，目前有許多數位音頻介面應用在不同的的領域上，其中最被大家所公認的世界音頻標準為：AES3與IEC60958-4，AES3一般都稱為專業性標準，而IEC60958-3則稱為消費性標準。

專業性與消費性這兩種標準間有些許的差異，而這些差異會使得兩者互不相容。嚴格來說，專業性與消費性這兩種界面是不應該被混合在一起。但事實上，兩者極為相似，在很多情形下，接上正確的電源後，被嵌入在訊號中的音頻訊號，是很容易的從一個標準傳達到另一個標準。

相容性的產生

相容性是指儀器內的相互聯繫，不會因規格有所不同而造成性能或機能的降低。為了達到這些標準的一致性，數位音頻儀器的使用者，應該預料到其中的相容性問題。

一般而言，數位音頻界面應傳達三種訊息：

1. 時間

2. 音頻資料

3. 非音頻資料

其中一些訊息可能會因為符合界面要求而改變或減少其音頻訊號。我們需就界面的習性與性能方面去考慮，例如一個接收器能承受多少訊號抖動(incoming jitter)或是一個範圍很寬的Frame rate以及一個發送器能否同時性地一直維持其精確性。接下來我們就來談談數位介面的介面格式。

Bi-phase編碼

在還沒使用Bi-phase編碼前，PCM ( pulse code modulation )音頻訊號很難確實地被傳送與接收。舉例來說，假設在一段時間內，所傳送的訊號像DC訊號，即所有的bits全部是1(或是0)，為了要正確地傳遞這訊號，與界面相關聯的電路必須是可以通過DC的。如果是傳遞一個「數位DC」訊號，clock速率可以說是沒有或很少變化，那麼一個分離式的同步連接器是不可或缺的。

應用方式

為了處理這些界面的問題，數位資料便改成Bi-phase編碼方式。其優點在於：若界面訊號中間，資料為一大串零時，也沒有所謂的DC效應，這樣就可以將訊號做AC-coupled通過變壓器或是通過一連串的電容器。

Bi-phase編碼的運作模式為：每一個data bit有一個time slot(圖一)，而這個time slot開始時會對前一state做轉換動作，並且結束於下一個轉換，而這也是下個time slot的開始。

假設這個data bit是一個 "1"，在這個time slot中間加入了轉態；而在下一個data "0"時，卻不會因此也在中間加轉態。這意思是就算一個有data 0的數位DC訊號，在每個time slot還是有轉態。這個計時器還是維持很規律的轉調，這時界面的訊號明顯地表現為AC，而轉調的方向(或訊號兩極性)會變為互不相關。這種編碼的組合使得接收器在接收資料時，可以很容易的重新建立取樣頻率。

《圖一　Bi-phase編碼的運作模式》

由上面敘述得知，Bi-phase編碼方式可歸納如下(圖二)：

1.每一筆資料編碼方式是由2個UI組成。

2.第一個UI:目前資料和前一筆資料相反。

3.第二個UI:若資料為1時，與第1個 UI 資料相反。

若資料為0時，與第1個 UI 資料相同。

《圖二　Bi-phase編碼方式》

因此當一資料呈現有轉態時，資料為1。

當資料為轉態時，資料為0。

Bi-phase coding 的優點

Bi-phase coding 在轉輸上的優點如下：

1.不會有連續2個以上的1出現，故傳輸時的接收端很容易判讀接收訊號是否正確。

2.DC成分很少，即不會有一連串1或0的資料出現在同一個Frame，缺少DC意味著當訊號經一長距離傳輸時，訊號振幅會因Cable阻抗衰減，剩下的訊號仍是對稱均勻，以致於訊號也能很容易被正確判讀出來。

3. 由於Bi-phase coding對極性不靈敏，即使對信號作反相也無影響，故對於接收端的界面影響不大。

Unit interval (單位區間)

量測界面的時間參數很多，通常使用的量測單位為單位區間(Unit interval)簡稱為UI，這是介於轉態間最短的間隔。Bi-phase編碼採用一個bit兩次轉態的編碼原則(data "1")，這表示一個time slot被限定寬為2 UI。例如在一個Frame中有64bits，則會有128個UI。通常在數位領域中，Delay和Jitter通常都用UI表示多於nanoseconds，因為UI和Sample rate有密切的關係。

較不易分析抖動和延遲

在48KHz的取樣頻率下，一個UI大約是162.7ns。相對的，在44.1KHz的取樣頻率下，一個UI約177ns。所以UI和取樣頻率的關係是相對的，在分析Jitter和Delay時，使用UI較容易表現出訊號的失真現像。

Frame (框架)

界面的資料傳送是連續性的，為了識別各種不同位元的資料，資料流就被分成64 time slot (或是128UI) 的Frame。由於time slots與data bits是一樣的，所以1個Frame經常是被說成64 bits。

每個Frame中包含了兩個Sub-frame，可以用來傳送兩個資料的通訊管道，例如Channel 1資料放在Sub-frame1，而Channel 2資料放在Sub-frame2。(圖三)為一個Frame，其中含有64個time slots (數字0到63)，一個Frame長為128UI。

《圖三　一個Frame的架構》

每個Sub-frame的前4個time slots傳送前導訊號，而這也記錄了Sub-frame的開始與識別Sub-frame的型態。接下來的24個time slots是傳送音頻資料，從LSB(least significant bit)開始傳送，一共傳送24個位元。而最後4個time slots是傳送：有效位元、使用者位元、通道狀態位元、以及同位元。

Preambles(前導訊號)

前導訊號是一個特殊的資料型態，傳送Sub-frame中最先的4個time slots，除了Sub-frame外，還記錄了每段的開始。一共有三種前導訊號，藉由持續3UI所產生一個或兩個脈波，來中斷雙階段編碼規則 (Bi-phase Coding Rule)；而中斷規則的意思是這種型態不可能發生在任何資料內。

為了區分每資料段(Block)的開始，在每192個Frame中，Sub-frame1則是開始在一個X 前導訊號，Sub-frame2總是開始於一個Y 前導訊號，若此Frame為資料段的起始Frame，則Sub-frame1中的X 前導訊號，將被Z 前導訊號所取代。

由於傳送的界面訊號可有效地反應出一般或被轉化兩極性，前導訊號可被視為一個負緣轉態的開始(圖四)或正緣轉態的開始(圖五)。

《圖四　負緣轉態開始的前導訊號》

《圖五　正緣轉態開始的前導訊號》

在Bi-phase編碼規則中，在每個time slot間都有個轉態，但是只有在前導訊號例外，因為在前導訊號中有兩個time slots，是沒有任何轉態。這些違反Bi-phase編碼是在time slot 0之後，每個前導訊號是在同個地方，這是為了確認一個新的Sub-frame已經開始，而接下來的位元也確認了是哪種Sub-frame。

圖三中SYNC位元數就是圖四與圖五中的訊號位置。這些前導訊號寬有8UI，所以在相同的時間內是相當於4個位元。這三種前導訊號連續三個UI保持在相同的準位，這情形是不可能在其他音頻資料或是輔助資料中發生。這三個單位UI的長脈衝呈現一個低頻的部分相對於整個串列資料，所以他們是最不受cable attenuation和cable induced jitter影響，所以我們常利用前導訊號來量測IC內部clock jitter。

Audio data (音頻資料)

在前導訊號後，音頻資料的LSB被先傳送出來，對音頻訊號來說，當音頻資料少於24位元時，調整資料的最高位元放置在MSB地方，剩餘的bits全部補0。如(圖六)所示。

《圖六　音頻資料的傳送模式》

輔助音頻資料

有一些音頻訊號，只傳送20位元或少於主要的音頻資料，所以利用前導訊號之後的前四個位元來當另一種訊號，而這訊號即為輔助音頻資料(auxiliary audio data)。如(圖七)所示，如果這輔助音頻資料被採用，通道狀態(Channel State)將表示出最高的字長為20位元，decoder會特別處理這輔助音頻訊號，使得任何訊號資料都無法加進主要的音頻資料中。可惜的是很多decoder都無法處理這輔助音頻資料。

《圖七　通道狀態將表示出最高的字長》

輔助音頻訊號的使用機會很少,其中一種是應用在聲音通訊方面，如AES3建議將輔助位元用來作bits調整的功用。例如：使用輔助音頻訊號來放置音頻訊號的壓縮資料，也是一種可行的方式。

Validity bit (有效位元)

有效位元本來就是用某種方式來證明傳遞資料的正確性；如果這位元為1，可以被確認的是，資料在轉換過程中，資料出現問題。所以有一些應用上的作法為：若發現有資料有錯誤時，有效位元就設定為1，並把資料隱藏起來。這種應用對CD players來說，相當普遍。

當一個訊號被標記成無效時，一個接收端決定應該如何去表現，這種困惑對這位有效的位元的功能性來說，並不是一件很容易的事。當使用IEC60958或是AES3格式來傳送資料時，若PCM音頻訊號無法很流暢時，這位元應被設定為1。這樣就有機會讓播放器的輸出變成為無聲，若能試圖將正確的音頻資料再重現，這麼做會更好。

防止噪音或爆音

對於在傳遞AES3或是IEC60958壓縮資料音頻方面，這位元需要被設定為1，這麼一來linear PCM接收器就可以辨識出何時必須要無聲。這潛在的優點是在Channel State模式中，在讀取非音頻(non-audio)位元時，可以確認這訊號不是linear PCM音頻，進而去阻止接收器從這資料中產生高度噪音或爆音。

User bit (使用者位元)

使用者位元可被用來傳輸使用者特殊的資訊，即消費性設備的特殊應用資訊，例如CD或是DCC。在消費性的規格方面，IEC60958-3已經定義在資料流中傳送分組格式資訊，且為了保護使用者資料，限定在使用不同種類儀器時的規則，如(圖八)所示。

《圖八　使用者位元層級與應用範圍》

在消費性格式中，資料流中的Sub-frame1與Sub-frame2相結合，而形成一組為2 bits/Frame的型態。這表示在一個44.1 kHz的Frame速率中，資料速率為88200 bits/sec，此即所謂的使用者資料流(user-data stream)。

專業規格可容納的資料

對AES3與IEC60958-4專業規格來說，已經有Channel State資料，所以可以容許不同格式當使用者資料(user-data)，如：

1. 每個資料段中，有192 bits當Channel State

2. AES18 (packet based)

3. IEC60958-3使用者資料的格式

對專業格式來說(除了IEC60958-3使用者資料格式外)，使用者資料流(user-data stream)是由Sub-frame1與Sub-frame2中的user bit所組成。因此，共有兩組資料流，每組有1 bit/Frame。在理論上，可以結合兩個使用者資料流其速率為2 bits/Frame，當作兩個Sub-frame傳送同一個Channel。不過到目前為止，專業性格式的應用較少人採取使用者資料(user-data)。

Channel Status bit (通道狀態位元)

在一被傳送的資料段(block)中，Channel State共有192位元，其Frame是開始於前導訊號 "Z"，這視為這資料段的第一位元，而這個Z 前導訊號有時被稱為 "block start"。每個Sub-frame1與Sub-frame2都有獨立的Channel State位元，所以經常是有兩組資料段(block)。常常這兩組資料段還傳送同一個資料，所以有很多接收器只檢測其中一個Sub-frame的資料。

如(圖九)為消費性格式的Channel State欄位、(圖十)為消費性格式的Channel State欄位解釋，(圖十一)為專業性格式的Channel State欄位，從這些圖中得知，兩者資料段內容解釋差異很大。

《圖九　消費性格式的Channel State欄位》

《圖十　消費性格式的Channel State欄位解釋》

《圖十一　專業性格式的Channel State欄位》

Channel State位元干擾

有些Channel State位元還會影響儀器處理音頻資料：特別是在non-audio和emphasis的領域中，對詮釋資料的方式，有著重大不相同處。

以"non-audio"來說，如果non-audio位元被設定為1時，音頻資料就不適合當linear PCM解碼資料。

當音頻訊號是使用在壓縮資料格式時，例如MPEG、DTS以及Dolby AC-3，這些都是"non-audio"，若把它們的音頻資料，直接當成是linear PCM並不恰當，而且還會造成高度的噪音。傳遞這些壓縮資料形式的標準為：以消費性應用方面，標準是IEC61937，而SMPTE337M就是對專業性方面的應用標準。

以"emphasis"來說，如果emphasis領域表示這訊號已經加強，那de-emphasis應該被應用在任何數位到類比的轉換。在消費性格式中，只有CD 格式才有支援emphasis；在零點與極點中，它具有一個高頻提升與50ms及15ms的時間常數。專業形式支持這個形式的有：J-17 emphasis，它的時間常數差不多為333ms及38.5ms。

就消費性與專業性形式來說，這些資料段裡位元的意義所解釋都不同。

Parity bit (同位元)

同位元是用來維持資料的偶數相同，作為錯誤檢查。特別的是在界面訊號中，偶數相同是表示在資料time slots 4 to 31中，共有偶數個中間層的轉態(即為1的意思)。

偶同位

偶同位對每個Sub-frame開始與在同方向的轉態有影響。因此，一個AES3或是IEC60958傳送器並不需要去計算同位元。由於在Sub-frame中，同位元是最後的位元，所以接收端只需要核對第二個Sub-frame的同位元狀態，因為它總是與先前的Sub-frame的狀態相同。

Bi-phase編碼資料若被干擾是可被查出，因為在消失不見的轉態中，至少有一個會在time slot的邊界上。比起使用同等位元，檢查Bi-phase編碼的干擾，可以更有幫助的來確認錯誤。

結論

在迅速崛起的IA時代中，數位音頻傳輸介面已經是一大家公認的標準，在目前IA設備中，數位音頻傳輸介面是不可或缺的，數位訊號規格幾乎都必須符合IEC60958或AES3規範，所以在數位音頻訊號領域，如DVD、VCD、CD、音效卡、甚至合成數位視訊，涉及內部資料傳送的工作者，瞭解IEC60958以及AES3規範是必要的。

‧	三波長堆疊雷射二極體設計
‧	藍光DVD與HD-DVD發展動向
‧	可錄式DVD用高功率紅光雷射最新技術動向
‧	綜觀DVD晶片產業發展趨勢
‧	剖析DVD新儲存規格技術發展趨勢

comments powered by Disqus

相關討論