账号:
密码:
CTIMES/SmartAuto / 新闻 /
NVIDIA在Interspeech大会分享表达性语言合成研究成果
 

【CTIMES/SmartAuto 王岫晨 报导】   2021年09月06日 星期一

浏览人次:【1387】
  

原本的自动电话语音和已经发展数十年的 GPS 导航系统都只能发出生硬的机器合成声音,而人工智慧 (AI) 却让智慧型手机和智慧音箱中的虚拟助理呈现逼真的语调。不过,AI 合成的声音和我们在日常对话及媒体中听到的真实人声之间,还是差了那麽一点,原因在於人们说话时带有复杂的节奏、音调和音色,这是很难以 AI 仿真出来的。

开发人员与创作者可运用最先进的表达性语言合成对话式人工智慧模型
开发人员与创作者可运用最先进的表达性语言合成对话式人工智慧模型

然而这个差距正在迅速缩小。NVIDIA 的研究人员正在打造高品质、可控制的语音合成模型与工具,它们能捕捉人类囗说声音中的丰富细节,又不会听起来人工感很重。研究人员也於 INTERSPEECH 2021 大会展示这项最新的研究成果。

这些模型有助银行和零售商的自动语音客服,也能让电玩游戏或书籍中的人物更为生动,并即时为数位分身加上合成语音。NVIDIA 内部的创意团队甚至运用这项技术,为一支介绍 AI 的系列影片制作出富有表现力的旁白内容。

表达性语言合成只是 NVIDIA Research 团队在对话式 AI 的其中一项研究,这个领域还包括自然语言处理、自动语音辨识、关键字侦测、音讯增强等。这项先进研究成果的部分内容已透过 NVIDIA NeMo 工具套件成为开放原始码,可以在 NGC 容器及其它软体中心取得,并经最隹化调整,能在 NVIDIA GPU 上高效执行。

關鍵字: GPU  边缘运算  NVIDIA 
相关新闻
NVIDIA携手慈济医院、资策会、商之器 共同打造AI乳癌筛检模型
NVIDIA AI Enterprise协助研究人员与医院成功锁定癌症目标
NVIDIA加速技术持续称霸HPC领域 采用率超过70%
西门子能源携手NVIDIA 为发电厂开发工业数位分身
长庚医院携手思科、英特尔与国众电脑 打造高速运算AI资讯中心
comments powered by Disqus
相关讨论
  相关新品
CWFA205: WiFi+BT
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
GPS SiP Module
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
CGPA10x: GPS SiP
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
  相关产品
» IAR Systems以NXP S32K3 MCU系列元件开发新一代汽车应用
» 凌华首款嵌入式MXM图形模组加速边缘运算和AI应用
» AMD Ryzen Threadripper PRO处理器提升NVIDIA云端游戏平台动能
» Power Integrations 推出InnoSwitch3-PD 系列开关 IC
» ADI推出临床级四项生命体徵AFE 适用於远端病人监测设备
  相关文章
» AI运算平台为医疗仪器和设备带来即时感测
» 结合物理模拟、AI与云端的系统级分析大计
» 虚拟与模拟的世界观
» ST:支付技术发展迅速 使用者渴??新的支付体验
» 超大规模运算五年内发挥积极影响力

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2021 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw