帳號:
密碼:
最新動態
產業快訊
CTIMES/SmartAuto / 新聞 /
微軟與光禾感知合作打造AI新聞主播
 

【CTIMES/SmartAuto 王岫晨 報導】   2023年10月16日 星期一

瀏覽人次:【1722】

生成式 AI 技術顛覆以往使用 AI 的方式,並深入各領域發展出多樣化的創新應用,而媒體產業在此波浪潮下也沒有缺席。相信大家對於在民視主播台上播報國際氣象的「敏熙」主播並不陌生,專攻影像技術的光禾感知以 AIGC(AI Generated Content,人工智慧生成內容)技術,結合微軟 Azure AI 語音服務,為民視新聞打造台灣首位 AI 生成的虛擬電視新聞主播。

微軟與光禾感知合作打造AI新聞主播
微軟與光禾感知合作打造AI新聞主播

光禾感知整合微軟技術 打造擬真AI主播「敏熙」

本次合作集結影像、聲音與新聞製播等三方專業技術,由光禾感知生成 AI 虛擬主播影像後,搭配微軟 Azure AI 的語音合成技術產出發音自然、流暢的播報人聲,再借助民視新聞多年新聞製播經驗,以及豐富的新聞播報、訪談節目等高畫質新聞影像資料庫進行形象優化,量身打造專屬於的 AI 主播模型。

光禾感知科技執行長王友光指出:「光禾感知 2022 年底開始投入 AI 主播製作,透過大量蒐集照片作為訓練原料,以擴散模型(Diffusion model)為技術基底,訓練出能夠生成動態圖像的模型,完成主播臉孔塑造。很高興此次與台灣微軟攜手促成民視『敏熙』主播的誕生,展現生成式 AI 於影像生成領域無限的技術發展潛力。」

除了外貌,聲音在新聞播報中亦扮演重要角色,微軟 Azure AI 語音服務的 TTS(文字轉語音)及 Viseme 技術即為實現敏熙主播自然且順暢人聲關鍵。不同於傳統如機械音般的文字轉語音服務,Azure AI 語音服務擁有豐富模型,提供 140 種語系以上、超過 400 個近似真人發音的預建神經語音模型供選擇。除了預建模型,Azure AI 語音服務還支援自訂模型,可根據您的需求調整語音的風格、速度、音調等參數,進而生成貼近真人主播具備情緒及抑揚頓挫的語音,展現出結合 AI 與美感的傳播科技成果。

此外,透過 Viseme 技術還能提升虛擬主播嘴型與播報文字精準度。Viseme 技術能夠在說話過程定義臉部及嘴唇、下顎及舌頭等位置,使虛擬主播臉部嘴型與語音的結合呈現更為自然。兩者技術相輔相成不僅能生成嘴型與聲音吻合的 AI 臉部影像,也能進一步實現多國語系主播的可能,敏熙現在已可以進行綜合中文及英文的播報內容。

關鍵字: 生成式AI  人工智慧  Microsoft(微軟光禾感知 
相關新聞
生成式AI海嘯來襲 企業更需AI雲端服務實現創新
研究:Android品牌多元化布局高階市場 本地化策略與技術創新將引領潮流
AI走進田間 加拿大團隊開發新技術提升農食產業永續發展
AI代理技術正迅速成為企業創新與提升競爭力的重要推動力
美國國家實驗室打造超級電腦 異構運算架構滿足HPC和AI需求
comments powered by Disqus
相關討論
  相關文章
» SiC MOSFET:意法半導體克服產業挑戰的顛覆性技術
» 意法半導體的邊緣AI永續發展策略:超越MEMS迎接真正挑戰
» 光通訊成長態勢明確 訊號完整性一測定江山
» 分眾顯示與其控制技術
» 新一代Microchip MCU韌體開發套件 : MCC Melody簡介


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.3.142.200.247
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw