搜尋

會員登入

搜尋

導覽

會員

聯發科、中研院、國教院 打造全球首款千億參數繁中AI語言模型

瀏覽次數:3859

由聯發科集團轄下的前瞻技術研究單位聯發創新基地、中央研究院詞庫小組和國家教育研究院三方所組成的研究團隊,今日開放全球第一款繁體中文語言模型到開源網站提供測試。本次公開釋出以開源語言模型BLOOM開發的繁體中文大型語言模型(large language model),比目前開源可用的最大繁體中文模型大1,000倍,所使用的訓練資料也多1,000倍。該模型已公開讓外界下載,可應用於問答系統、文字編修、廣告文案生成、華語教學、客服系統等。


聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及國教院,成為台灣極少數能訓練大型語言模型的團隊,以透明、開放和包容的方式,善用技術、人才及資源,既發展自主訓練大型人工智慧模型的能力,也讓繁體中文的大型語言模型研究及應用更為普及。」


開放原始碼釋出的大型語言模型,目前多數仍以英文為主要優化的對象,繁體中文的語言模型相對不足。為此中央研究院詞庫小組在2019年開發並公開BERT和GPT-2的繁體中文優化版本,但是因為資料量的差距,這些模型與主流的大型語言模型差距越來越大。有鑑於開放原始碼繁體中文大型語言模型的重要性與迫切性,在2022年5月,聯發創新基地、中央研究院和國家教育研究院展開合作計畫,使用大型語言模型BLOOM的繁體中文模型再訓練與優化。目前開放系列中第一個有量級跳躍意義的繁體中文語言模型,聯發創新基地也暫備一個手機網頁的介面,供語言模型研究者試用。此模型系列的評量指標,以及參數量更大(176B)的模型,將會陸續開放下載。
...
...

使用者別 新聞閱讀限制 文章閱讀限制 出版品優惠
一般使用者 10則/每30天 0則/每30天 付費下載
VIP會員 無限制 25則/每30天 付費下載

Card Image

定義兆瓦級AI工廠 英飛凌以固態電力技術 驅動直流微電網革命

在代理式AI發展如火如荼的新時代,全球對算力的需求正以倍速增加,這股力量也直接拉升了資料中心的能耗基準,傳統的電力架構已難以支撐未來的AI算力需求。 英飛凌(Infineon)…

在代理式AI發展如火如荼的新時代,全球對算力的需求正以倍速增加…