帳號:
密碼:
CTIMES / 文章 /   
嵌入式處理器技術發展之分析
 

【作者: Markus Levy】   2004年02月05日 星期四

瀏覽人次:【940】
  

儘管高科技產業發展起伏不定,但嵌入式產業卻始終維持強勁地發展,不論在精密度、複雜度及實用性上都到達前所未有的里程。隨著嵌入式應用領域日益擴展至手機、磁碟機、PDA、網路交換機、印表機等廣泛市場中,要為「嵌入式」這個概念找尋其適當定義就變得越來越困難。不過,可以肯定的是嵌入式領域內的各項應用在性能、價格、功耗等指標都有著不同的需求。為了適應這些不同需求,直接驅動各種應用的處理器亦同時迅速發展。舉例而言,在過去十年中,ARM處理器已經從簡單的ARM7TDMI核心發展到了最新的ARM11EJ-S核心。


成功要素

基本上,一款處理器是否能在市場上生存與成功取決於客戶的滿意度,而客戶滿意度又由許多數量及質量上的因素決定。質量因素包括客戶關係、技術支援、客戶服務、新品開發、公司穩定性及豐富的產品線等等。儘管很難用這些指標具體衡量與比較不同處理器供應商,但可以確定的是多數的處理器供應商(包括矽智產供應商)在上述各項上都表現得差強人意。特別對IP供應商來說,要滿足這些需求似乎更加困難,因為他們必須先試著瞭解客戶的各種需求。舉例而言,一個IP供應商要能同時針對具有豐富晶片製造經驗的大廠,或者沒有任何製造經驗的新興設計公司,甚至無工廠的半導體製造商提供足夠的技術支援及服務。


性能分析

雖然某些定量指標能夠幫助使用者在不同處理器間進行比較,但是一次詳盡的分析比較仍然非常重要。這些需要仔細衡量的因素包括:性能分析、功耗和效率分析、開發工具支援以及價格(必須從設備和系統角度全面考慮)。


嵌入式領域中有許多用來分析處理器性能的標準,例如測量開處理器執行一段指定程式的速度。原則上,最理想的測試向量應該是應用程式本身,在選擇處理平臺時,能夠滿足工作效能,且價格最低、功耗最小的處理器即為客戶首選。但是此種性能分析法實際上很難應用,因為將使用者程式在各種硬體平臺上進行移植和優化的過程相當繁複,而這樣的過程卻是使應用能有效運作的必要條件。尤其在眾多的處理器當中進行初選的時候,此種方式更不可行。


目前,一般消費者能夠使用的測試向量非常多,問題是如何正確選擇最為接近目標應用的測試向量。換句話說,要先明確預期最終應用程式在待選平臺上的運行情況和測試目的,然後再挑選符合要求的特定測試向量。


市面上最普遍適用的測試向量是Dhrystone,但EEMBC驗證實驗室(EEMBC Certification Labs; ECL)的最新研究指出,Dhrystone不僅不適於作為嵌入式系統的測試向量,甚至在其他大多數場合下都不適合進行應用。Dhrystone有許多漏洞,例如:易被非法利用、人為痕跡明顯、代碼長度太短、缺乏驗證及標準的運行規則等等。


現在新興流行的測試向量則是業界統一標準的EEMBC測試向量。EEMBC (Embedded Microprocessor Benchmark Consortium)是一個非營利性組織,致力於幫助設計人員快速有效地選擇處理器。該組織到目前為止共發佈了四十六個性能測試向量,分別應用於電信、網路、消費性產品、辦公室設備和汽車電子這五大領域。 EEMBC另外一個重要的功能是為所有測試向量發佈一個正式的測評結果認證,以有效地確保組織的權威性。


EEMBC 一般使用兩種測評模式:標準型(out-of-the-box)和全定制型(full-fury)。標準型模式允許用戶使用各種代碼編譯器選項設置,但不可改變測試向量的源代碼,其主要目的是為測試處理器和回應編譯器的能力。相反的,全定制型模式則允許修改測試向量的代碼,用戶可從性能最優的角度考慮,使用彙編、專用庫函數、硬體加速程式等各種可能有效的手段,目的是測試該處理器的最大性能指標。如果用這兩種模式測試的結果相差很大,就表示系統設計者在使用該處理器時,移植工作量將會很大。反之,如果兩者的差別很小,那麼就表示細微的代碼改動(甚至可能只需要作一些編譯器優化設置)就可能帶來大幅度的性能提升。


結構分析

分析測試向量和比較處理平臺既是一門科學,也是一門藝術。其特色在於該分析講究求實事求是的同時又充滿變數。舉例來說,(圖一)比較了幾種不同處理器的性能。乍看之下,摩托羅拉MPC7455顯然是效能最好的一款處理器,不過僅針對蘋果電腦或高階網路路由器應用而言。假若是應用在手機或其他手持式設備時,單位功耗下各處理器的性能比較又成為選擇的關鍵。在這種情況下,ARM1020E很明顯是最好的選擇。



《圖一 以EEMBC的Telemark比較各種處理器的性能及功耗》
《圖一 以EEMBC的Telemark比較各種處理器的性能及功耗》

有時採用將測試向量加以標準化為共同頻率的方式來比較各種處理器的效能會比較容易。此外,還能夠以每MHz處理器完成的迴圈或更迭次數來進行比較,此種方式能協助統計系統每次指令花費的平均週期數(CPI )或每個週期能夠完成的指令數(IPC)。IPC以處理器每個時鐘週期內可完成的工作量衡量該處理器的效率,這對於用電池供電的應用來說十分有效。當然,將測試向量標準化進行比較可能抹殺一些處理器架構系統上的特性。設計各種不同架構系統的目的在於面對特定應用時,處理器能有更高的效率。例如,某些核心為提高頻率性能,而設計成排線較長及複雜的記憶體控制系統。



《圖二 ARM核心的排線結構演變過程》
《圖二 ARM核心的排線結構演變過程》

ARM處理器微架構的演變

ARM處理器在客戶回應、製程進步及技術創新基礎上不斷長期演進。但若只將焦點放在IPC上,則無法看到此一系列演變所帶來的進步。(圖二)說明了ARM處理器架構發展的過程,從一個簡單的三級排線演進到先進的八級排線架構。令人訝異的是,若僅用單一時鐘為基礎進行處理器的比較,則性能差別非常的小。然而,在現實應用中,ARM11顯然是ARM家族中性能最強的系列產品。這是因為ARM7通常只能在200MHz以下頻率運行,而在0.13微米製程下,ARM11的運行頻率高達500~700MHz,自然就帶來更強大的性能。


ARM處理器在增加排線級數的同時,更進行其他結構設計方面的改進。例如在ARM1026EJ-S核心中,利用一個返回堆疊減少副程式返回時的排線刷新時間,從而大幅度地提高了系統性能。


EEMBC的測試結果顯示此種返回堆疊平均能夠提高1.1%的效能,在某些特殊應用上,效能提升的更為明顯。事實上,EEMBC大多數測試向量並不使用太多副程式,因此某種程度上低估了返回堆疊的作用。


ARM11中另一個重要的結構改進,是靜、動態組合轉換的預測功能。ARM11包含一個64埠、四種狀態的位址轉換緩存區,用來存儲最近使用過的轉換位址。靜態轉換預測用來處理動態轉換預測無法在位址緩存區中找到的位址。透過EEMBC的測試結果分析,使用靜態轉換預測能夠正確判斷出77%的轉換位址,使用動態轉換預測功能則可達到88%的正確率,而若將靜態和動態轉換預測功能合併使用,則可達到92%的轉換預測準確度。如此一來將會大幅提高IPC指標的可信度,尤其是針對那些存在許多條件轉換指令的測試向量或應用程式。


發展持續中

除了繼續發展架構及微架構技術外,還有許多方法能夠應用在提高處理器的性能上,例如新的ARM11支援單指令多資料(SIMD)指令,能夠使某些演算法的運算速度提高二到三倍。通過AMBA匯流排加入的特殊輔助運算器甚至能夠使系統性能提高更多。Amphion最新的JPEG2000編碼器使用通用的ARM處理器,即能夠滿足即時壓縮尺寸超過電視標準圖像的需求。(作者為EEMBC總裁)


相關文章
安全的乘車體驗仰賴安全防護
從台灣心 走向世界心
comments powered by Disqus
相關討論
  相關新品
Lattice ECP3 Video Protocol Board
原廠/品牌:Lattice
供應商:Lattice
產品類別:FPGA
CWFA205: WiFi+BT
原廠/品牌:鉅景
供應商:鉅景
產品類別:RF
GPS SiP Module
原廠/品牌:鉅景
供應商:鉅景
產品類別:RF
  相關新聞
» ST:安全性是聯網汽車最關鍵要素
» 擴展應用領域 AMD嵌入式處理器效能再突破
» PI第三代InnoSwitch3-Pro提供程式化供電能力
» ARM:視訊體驗與機器學習將造就新一代手機
» 行車輔助系統當道 ST推最新一代車載鏡頭應戰
  相關產品
» 創惟發表快速讀取的UHS-I讀卡機控制晶片
» 群聯提供UFS 3.0矽智財授權 因應異質整合需求
» 芯原Vivante VIP8000神經網路處理器IP每秒可提供超過3 Tera MAC
» 實現下一代除錯與追蹤功能 ARM推出CoreSight SoC-600
» Maxim最新嵌入式安全平臺輕鬆實現公開金鑰加密

AD


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2018 遠播資訊股份有限公司版權所有 Powered by O3
地址:台北市中山北路三段29號11樓 / 電話 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw