NVIDIA在Interspeech大會分享表達性語言合成研究成果

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES/SmartAuto / 新聞 /

NVIDIA在Interspeech大會分享表達性語言合成研究成果

【CTIMES/SmartAuto 王岫晨報導】 2021年09月06日星期一

瀏覽人次：【2464】

原本的自動電話語音和已經發展數十年的 GPS 導航系統都只能發出生硬的機器合成聲音，而人工智慧 (AI) 卻讓智慧型手機和智慧音箱中的虛擬助理呈現逼真的語調。不過，AI 合成的聲音和我們在日常對話及媒體中聽到的真實人聲之間，還是差了那麼一點，原因在於人們說話時帶有複雜的節奏、音調和音色，這是很難以 AI 仿真出來的。

開發人員與創作者可運用最先進的表達性語言合成對話式人工智慧模型

然而這個差距正在迅速縮小。NVIDIA 的研究人員正在打造高品質、可控制的語音合成模型與工具，它們能捕捉人類口說聲音中的豐富細節，又不會聽起來人工感很重。研究人員也於 INTERSPEECH 2021 大會展示這項最新的研究成果。

這些模型有助銀行和零售商的自動語音客服，也能讓電玩遊戲或書籍中的人物更為生動，並即時為數位分身加上合成語音。NVIDIA 內部的創意團隊甚至運用這項技術，為一支介紹 AI 的系列影片製作出富有表現力的旁白內容。

表達性語言合成只是 NVIDIA Research 團隊在對話式 AI 的其中一項研究，這個領域還包括自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等。這項先進研究成果的部分內容已透過 NVIDIA NeMo 工具套件成為開放原始碼，可以在 NGC 容器及其它軟體中心取得，並經最佳化調整，能在 NVIDIA GPU 上高效執行。

關鍵字： GPU 邊緣運算 NVIDIA

相關新聞

‧	NVIDIA AI Blueprint協助開發視覺AI代理以提高效率、最佳化流程並創造空間
‧	AMD攜手合作夥伴擴展AI解決方案全方位強化AI策略布局
‧	印度機器人生態系利用NVIDIA創新　從倉儲自動化到最後一哩路配送
‧	NVIDIA乙太網路技術加速被應用於建造全球最大AI超級電腦
‧	2024 Arm科技論壇台北展開推動建構運算未來的人工智慧革命

comments powered by Disqus

相關討論

»	機器視覺與電腦視覺技術的不同應用
»	STM32MP25系列MPU加速邊緣AI應用發展開啟嵌入式智慧新時代
»	STM32 MCU產品線再添新成員 STM32H7R/S與STM32U0各擅勝場
»	STM32WBA系列推動物聯網發展多協定無線連接成效率關鍵
»	開啟邊緣智能新時代 ST引領AI開發潮流

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.2048.3.138.143.72
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: webmaster@ctimes.com.tw