帳號:
密碼:
最新動態
 
產業快訊
CTIMES / 文章 /
親愛的我把AI模型縮小了- 模型減量與壓縮技術簡介
【vMaker Edge AI專欄 #08】

【作者: Jack OmniXRI】   2023年08月30日 星期三

瀏覽人次:【2329】

1989年科幻電影「親愛的,我把孩子縮小了」,2015年「蟻人」,2017年「縮小人生」,以及我們從小看到大的多啦A夢「縮小燈」、「縮小隧道」,都不約而同的提到一個概念,就是可以透過一種神奇的機器,就能把人的體積大幅縮小但生理機能完全不減。這裡姑且不論是否符合物理定律,但如果真的能實現,就會像「縮小人生」中所提到的,可大幅減少地球資源的浪費,大幅改善人類的生存環境。雖然以上提及的技術可能我們這輩子都難以看到實現的一天,但把超巨大的AI模型縮小但仍保持推論精度不變,還是有很多方法可以達到的。接下來我們就來幫大家簡單介紹一下幾種常見技術。


1. AI模型組成元素

回顧一下本專欄三月份文章[1]第1小節提及的神經網路架構,其組成內容主要包括神經元內容(包含數量)、網路結構(神經元連接拓撲)及每個連結的權重值,如Fig. 2所示。簡單的卷積神經網路(CNN)如LeNet-5,就有約6萬個權重,而大型模型VGG16則有約1.38億個權重,到了現在流行的大型語言模型GPT-3已激激增到1750億個權重,更不要說像GPT-4已有超過一兆個權重。
...
...

使用者別 新聞閱讀限制 文章閱讀限制 出版品優惠
一般訪客 10則/每30天 5/則/每30天 付費下載
VIP會員 無限制 20則/每30天 付費下載
相關文章
以STM32生態系統擴充套件加速AI模型部署
工程師工具箱內的秘密武器:AI與模擬的交集
4種經過實證的AI演算法應用
自行調適運算平台帶來高效能AI加速
comments powered by Disqus
相關討論
  相關新聞
» 2024中華郵政大數據競賽廣納全台42校AI創意
» 資通電腦攜手道瓊斯探討貿易合規風險與關鍵應對策略
» 英業達、雙融域攜手內容業者打造文化科技新商模
» 資策會生命守護通道系統獲2024年智慧城市獎首獎
» TXOne Networks新一代Edge工控網路防護方案 更新韌體並納入AI


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.1.HK8AIAJFCKESTACUKZ
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw