加快低功率嵌入式系統中的機器學習技術應用
CEVA推出深層神經網路架構

2015年10月27日 星期二
【科技日報編輯部報導】

CEVA公司推出即時神經網路軟體架構CEVA 深層神經網路(CEVA Deep Neural Network, CDNN),以簡化低功率嵌入式系統中的機器學習部署。CDNN充分利用CEVA-XM4 成像和視覺DSP的處理能力,使得嵌入式系統執行深層學習任務的速度比建基於GPU的系統提高三倍,同時消耗的功率減少三十倍,且所需的記憶體頻寬也減少十五倍。例如,在28nm下對每秒 30幀的1080p串流視訊運行建基於深層神經網路(DNN)的行人檢測演算法時,所需功率不到30mW。

CDNN充分利用CEVA-XM4 成像和視覺DSP的處理能力,使得嵌入式系統執行深層學習任務的速度比建基於GPU的系統提高三倍...
CDNN充分利用CEVA-XM4 成像和視覺DSP的處理能力,使得嵌入式系統執行深層學習任務的速度比建基於GPU的系統提高三倍...

CDNN具備高性能、低功率和低記憶體頻寬的關鍵是CEVA網路產生器(CEVA Network Generator),這項專有的自動化技術能夠將客戶的網路結構和權重轉換為在即時情況下使用的纖細客製化網路模型,以實現可以顯著減少功耗和記憶體頻寬、且速度更快的網路模型,與原本的網路相比,其精度衰退的程度不到1%。一旦產生了這個客製化嵌入就緒的網路,便可使用完全最佳化的卷積神經網路(Convolutional Neural Network, CNN)層、軟體庫和API在CEVA-XM4圖像和視覺DSP上運行。

CEVA公司CEVAnet合作夥伴計畫的成員之一Phi Algorithm Solutions已經利用CDNN,為CEVA-XM4 DSP實施了一個建基於CNN的通用目標檢測(Universal Object Detector)演算法。現在應用開發人員和OEM廠商可以把這個演算法用於各種應用,包括用於安全需求的行人檢測和面部檢測、先進駕駛輔助系統(ADAS)和建基於低功耗相機功能系統的其它嵌入式設備。

Phi Algorithm Solutions總裁兼共同創辦人Steven Hanna表示:「CEVA深層神經網路架構為我們建基於卷積神經網路的演算法提供了一條從離線訓練到即時檢測的快速而流暢之途徑,使得我們能夠在短短幾天之內獲得經過最佳化的獨特目標檢測網路實施方案,且功耗明顯比其它平臺低許多。CEVA-XM4圖像和視覺DSP結合CDNN架構,是嵌入式視覺設備的理想選擇,並且為使用深層學習技術的人工智慧設備在未來數年的發展奠下了穩定基礎。」

CEVA行銷副總裁Eran Briman表示:「到目前為止,我們已贏得了二十多項設計,讓我們得以在嵌入式視覺處理器領域持續保持優勢,而我們也不斷地強化視覺IP產品的組合,從而協助客戶以更短的時間將產品推出,以及把風險減至最低。我們用於CEVA-XM4的新型深層神經網路架構是嵌入技術產業中第一款同類產品,為尋求在功率受限的嵌入式系統中實施可行深層學習演算法的開發人員向前邁出一大步。」

CDNN軟體架構將以原始程式碼的形式提供,擴展了CEVA-XM現有的應用開發人員套件(ADK)。它靈活性高並採用模組化設計,能夠支援完整的CNN實施方案或特定層,並且可與各種網路和結構共用,比如使用Caffe、Torch或Theano訓練架構開發的網路,或專有網路。CDNN包括用於圖像分類、定位和目標識別的即時範例模型,可用於目標和場景識別、先進駕駛輔助系統(ADAS)、人工智慧(AI)、視頻分析、擴增實境(AR)、虛擬實境(VR)和類似的電腦視覺應用。CEVA公司將在11月12日舉辦一場針對實施嵌入式系統機器視覺應用的即時網路研討會,其中將包括對CDNN的深入探討。(編輯部陳復霞整理)


關鍵字: 深層神經網路架構   CDNN   嵌入式系統   DSP ( 數位訊號處理器 )   CEVA   網際建構與管理