账号:
密码:
CTIMES / 文章 /   
云端语音辨识
 

【作者: 徐文達】2017年05月22日 星期一

浏览人次:【25961】
  

云端语音辨识


语音辨识是将语音即时的转换成文字,而这音源是源自麦克风或是其它的音讯来源,将其音讯传送到伺服器运算处理或是本地运算辨识。而当将音讯传送到伺服器时,可得到回传的辨识结果,例如文字或是解析音讯的意图;例如“台北市的天气“等等。而当应用程式回应使用者时,此时需要将文字转换成语音。


在将语音串流进入辨识前,需要做杂音抑制处理,如果这部分没有处理好,会降低系统的辨识率;例如在安静的环境下,辨识率是很高的,而在杂音较多的地方,是不是也能确实做到语音辨识呢?



如何的保持声音的品质呢?将噪音消除,可以透过降噪的处理方式,如下图:


在降噪的技术里有Feedback ANC及Feed-Forward ANC等等,而这噪音的调校又会跟本身的机构、麦克风的位置、方向是息息相关,缺一不可。



当正确取得声音串流时,后续就是选择语音的辨识伺服器,以Google所提供的平台为例,它提供了一系列的Cloud Speech API,让使用者可以轻松的应用语音辨识的控制。


而将声音串流录制并传送到伺服器及进行本地的语音回应输出、控制;这时你需要一个强而有力的控制平台,想当然尔,大多数会选择Linux 平台,可以快速的取得相关的资源并连结网路,所以在挑选Linux 开发平台时,最重要的要确认平台是否有持续支援Linux main line,这是一个非常重要的指标,以确保你的Linux 平台是可以持续的支援新的Linux 版本。




Microchip 的产品 SAMA5D2 系列提供Linux 开发平台及及丰富周边控制模组,让你可以快速的建立产品应用。而为了缩短使用者的开发时间,也提供SoM的开发平台,这可以大大的降低使用者的开发时间及硬体的设计难度。


未来全球语音辨识市场将会变得更加多样化,同时软体准确度上会有大幅提升。


在医疗领域的应用:


不仅是简单的通过智慧手表追踪运动情况和心率,还有直接根据人的身体状况匹配相应的服务如合适的餐厅或食物等,当然这些大多是基于穿戴式设备的。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。由于医疗领域词汇库专业性强演变性弱,只要建立完整的数据库,就可以做到对疾病名称、药品名称相对精确的识别。


在智慧车载的应用:



行车安全问题上一直聚焦了很多目光,去年有人曾经设计出一个车载屏幕,可以利用多指的简单手势解决司机操作触控萤幕过度分散注意力的问题。通过将车载平台与手机连接,可以帮用户实现语音控制GPS导航,讯息收发,电话接打,社群网路更新等等。 http://www.microchip.com/design-centers/32-bit-mpus 欢迎造访


浏览更多相关技术资料!


相关文章
展??智慧显示制造大势 一窥纵横整合新契机
异质整合 揭??半导体未来20年产业蓝图
基地台和元件中,部署并测试MIMO和波束成形技术的 3大挑战
无线音讯串流让电玩游戏音讯不间断
水辅制程动态流体预测之满射倒流法验证
comments powered by Disqus
相关讨论
  相关新品
Arduino Motor Shield
原厂/品牌:RS
供应商:RS
產品類別:
mbed
原厂/品牌:RS
供应商:RS
產品類別:
Raspberry Pi
原厂/品牌:RS
供应商:RS
產品類別:
  相关新闻
» 见证IC产业前世今生 「IC积体电路特展」多元化呈现
» IEK: 台湾智慧制造生态系规模底定 加速半导体等关键产业应用扩散
» SEMICON Taiwan 2018国际半导体展暨IC60大师论坛即将登场
» 工研院AIoT!席卷产业新革命:智慧车辆
» Mouser即日起供应Molex ValuSeal IP65线对线连接器
  相关产品
» 雅特生ERM电源转换器模组系列添加72个全新型号
» 威世科技新型IHLP电感具有耐高温性能
» Maxim发布最新Himalaya DC-DC降压转换器
» Vicor推出全新20 Amp 48V Cool-Power ZVS降压稳压器系列首款产品
» Diodes公司带高压电晶体之切换式稳压器提高线式充电器效率

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2019 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw