在人工智慧(AI)技術日新月異的當下,DeepSeek的出現無疑為產業投下了一顆震撼彈。為了解析DeepSeek產業的影響,以及台灣的AI相關供應鏈該如何因應,CTIMES東西講座特別邀請資策會產業情報研究所分析師楊智傑,針對DeepSeek對AI產業的影響與衝擊進行分享,深入剖析這項技術可能為台灣在全球AI供應鏈中帶來的挑戰與商機。

圖一 : 資策會產業情報研究所分析師楊智傑,針對DeepSeek對AI產業的影響與衝擊進行分享,深入剖析這項技術可能為台灣在全球AI供應鏈中帶來的挑戰與商機。 |
|
楊智傑首先回顧了AI的發展歷程,從早期的符號邏輯、專家系統,到現今的深度學習,AI技術不斷演進。他指出,目前的第三波AI浪潮,以深度學習為核心,自2022年底ChatGPT問世以來,持續為產業帶來衝擊。
AI三大要素:算力、資料、演算法
楊智傑強調,AI的發展離不開三大要素,分別是「算力、資料、演算法」。算力即是硬體伺服器的運算能力,而台灣在全球算力供應鏈中扮演重要角色;資料則是AI模型訓練的基礎,高品質資料對於提升AI效能至關重要;演算法則是如何最佳化算力與資料的運用,提升AI模型的效率與準確性。
楊智傑指出,在DeepSeek出現之前,產業多聚焦於算力提升,尤其以Nvidia GPU的供應為關鍵。然而,DeepSeek的出現,讓人們開始思考,是否能在演算法與資料優化上取得突破,進而降低對高階GPU硬體的依賴?這無疑為AI產業帶來了新的發展思路。
楊智傑進一步比較了DeepSeek-R1和OpenAI的o1模型,在多個AI效能測試中的表現。他指出,DeepSeek-R1在數學推理和軟體工程任務上展現了優勢,而OpenAI的o1則在一般知識和問題解決方面略有領先;另外,DeepSeek在模型的監督微調、獎勵模型以及MoE(混合專家)的運用上做了高度的優化。
在訓練方法上,DeepSeek結合了FP16和INT8的優點,以提升效率並保持數值穩定,同時也運用了多頭注意力機制、Multi-Token Prediction、MoE、稀疏矩陣運算等多種技術,並搭配多次的監督式微調和強化學習,使之降低對算力的需求,同時提高準確度 。
楊智傑也說明了DeepSeek在強化學習和監督式微調方面的技術應用,並強調了其在AI推論方面利用優化架構和MoE來降低成本的策略。
AI大推理時代來臨 台灣挑戰與商機共存
楊智傑表示,台灣在全球AI供應鏈中佔有舉足輕重的地位,無論是半導體製造或AI伺服器組裝,都具備優勢。然而,DeepSeek的出現也可能帶來挑戰,因此台灣產業應該盡早思考如何應用。
包含在演算法與資料優化上持續精進,把握AI大推理時代的新趨勢,另外也要掌握DeepSeek所帶來的機會, 進一步強化台灣AI產業在全球供應鏈中的競爭力。
楊志傑認為,DeepSeek的出現,預示著AI大推理時代的來臨。這不僅僅是技術的變革,更將對各行各業產生深遠影響。台灣產業應積極應對,把握機遇,迎接AI時代的新挑戰。
如需了解更多相關內容,請連結下列頻道網址: