账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 新闻 /
微软与光禾感知合作打造AI新闻主播
 

【CTIMES / SMARTAUTO ABC_1 报导】    2023年10月16日 星期一

浏览人次:【1721】

生成式 AI 技术颠覆以往使用 AI 的方式,并深入各领域发展出多样化的创新应用,而媒体产业在此波浪潮下也没有缺席。相信大家对於在民视主播台上播报国际气象的「敏熙」主播并不陌生,专攻影像技术的光禾感知以 AIGC(AI Generated Content,人工智慧生成内容)技术,结合微软 Azure AI 语音服务,为民视新闻打造台湾首位 AI 生成的虚拟电视新闻主播。

微软与光禾感知合作打造AI新闻主播
微软与光禾感知合作打造AI新闻主播

光禾感知整合微软技术 打造拟真AI主播「敏熙」

本次合作集结影像、声音与新闻制播等三方专业技术,由光禾感知生成 AI 虚拟主播影像後,搭配微软 Azure AI 的语音合成技术产出发音自然、流畅的播报人声,再借助民视新闻多年新闻制播经验,以及丰富的新闻播报、访谈节目等高画质新闻影像资料库进行形象优化,量身打造专属於的 AI 主播模型。

光禾感知科技执行长王友光指出:「光禾感知 2022 年底开始投入 AI 主播制作,透过大量搜集照片作为训练原料,以扩散模型(Diffusion model)为技术基底,训练出能够生成动态图像的模型,完成主播脸孔塑造。很高兴此次与台湾微软携手促成民视『敏熙』主播的诞生,展现生成式 AI 於影像生成领域无限的技术发展潜力。」

除了外貌,声音在新闻播报中亦扮演重要角色,微软 Azure AI 语音服务的 TTS(文字转语音)及 Viseme 技术即为实现敏熙主播自然且顺畅人声关键。不同於传统如机械音般的文字转语音服务,Azure AI 语音服务拥有丰富模型,提供 140 种语系以上、超过 400 个近似真人发音的预建神经语音模型供选择。除了预建模型,Azure AI 语音服务还支援自订模型,可根据您的需求调整语音的风格、速度、音调等叁数,进而生成贴近真人主播具备情绪及抑扬顿挫的语音,展现出结合 AI 与美感的传播科技成果。

此外,透过 Viseme 技术还能提升虚拟主播嘴型与播报文字精准度。Viseme 技术能够在说话过程定义脸部及嘴唇、下颚及舌头等位置,使虚拟主播脸部嘴型与语音的结合呈现更为自然。两者技术相辅相成不仅能生成嘴型与声音吻合的 AI 脸部影像,也能进一步实现多国语系主播的可能,敏熙现在已可以进行综合中文及英文的播报内容。

關鍵字: 生成式AI  人工智能  Microsoft  光禾感知 
相关新闻
生成式AI海啸来袭 企业更需要AI云端服务来实现创新与发展
研究:Android品牌多元化布局高阶市场 本地化策略与技术创新将引领潮流
AI走进田间 加拿大团队开发新技术提升农食产业永续发展
AI代理技术正迅速成为企业创新与提升竞争力的重要推动力
美国国家实验室打造超级电脑 显示异构运算架构能满足HPC和AI双重需求
comments powered by Disqus
相关讨论
  相关文章
» SiC MOSFET:意法半导体克服产业挑战的颠覆性技术
» 超越MEMS迎接真正挑战 意法半导体的边缘AI永续发展策略
» 光通讯成长态势明确 讯号完整性一测定江山
» 分众显示与其控制技术
» 新一代Microchip MCU韧体开发套件 : MCC Melody简介


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8BOBPGHN8STACUKD
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw