账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
云端语音辨识
 

【作者: 徐文達】2017年05月22日 星期一

浏览人次:【38102】

云端语音辨识


语音辨识是将语音即时的转换成文字,而这音源是源自麦克风或是其它的音讯来源,将其音讯传送到伺服器运算处理或是本地运算辨识。而当将音讯传送到伺服器时,可得到回传的辨识结果,例如文字或是解析音讯的意图;例如“台北市的天气“等等。而当应用程式回应使用者时,此时需要将文字转换成语音。


在将语音串流进入辨识前,需要做杂音抑制处理,如果这部分没有处理好,会降低系统的辨识率;例如在安静的环境下,辨识率是很高的,而在杂音较多的地方,是不是也能确实做到语音辨识呢?



如何的保持声音的品质呢?将噪音消除,可以透过降噪的处理方式,如下图:


在降噪的技术里有Feedback ANC及Feed-Forward ANC等等,而这噪音的调校又会跟本身的机构、麦克风的位置、方向是息息相关,缺一不可。



当正确取得声音串流时,后续就是选择语音的辨识伺服器,以Google所提供的平台为例,它提供了一系列的Cloud Speech API,让使用者可以轻松的应用语音辨识的控制。


而将声音串流录制并传送到伺服器及进行本地的语音回应输出、控制;这时你需要一个强而有力的控制平台,想当然尔,大多数会选择Linux 平台,可以快速的取得相关的资源并连结网路,所以在挑选Linux 开发平台时,最重要的要确认平台是否有持续支援Linux main line,这是一个非常重要的指标,以确保你的Linux 平台是可以持续的支援新的Linux 版本。




Microchip 的产品 SAMA5D2 系列提供Linux 开发平台及及丰富周边控制模组,让你可以快速的建立产品应用。而为了缩短使用者的开发时间,也提供SoM的开发平台,这可以大大的降低使用者的开发时间及硬体的设计难度。


未来全球语音辨识市场将会变得更加多样化,同时软体准确度上会有大幅提升。


在医疗领域的应用:


不仅是简单的通过智慧手表追踪运动情况和心率,还有直接根据人的身体状况匹配相应的服务如合适的餐厅或食物等,当然这些大多是基于穿戴式设备的。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。由于医疗领域词汇库专业性强演变性弱,只要建立完整的数据库,就可以做到对疾病名称、药品名称相对精确的识别。


在智慧车载的应用:



行车安全问题上一直聚焦了很多目光,去年有人曾经设计出一个车载屏幕,可以利用多指的简单手势解决司机操作触控萤幕过度分散注意力的问题。通过将车载平台与手机连接,可以帮用户实现语音控制GPS导航,讯息收发,电话接打,社群网路更新等等。 http://www.microchip.com/design-centers/32-bit-mpus 欢迎造访


浏览更多相关技术资料!


相关文章
使用Microchip Inductive Position Sensor(电感式位置传感器)实现高精度马达控制
以霍尔效应电流感测器简化高电压感测
ESG趋势展??:引领企业迈向绿色未来
落实马达节能维运服务
IPC的8个趋势与5个挑战
comments powered by Disqus
相关讨论
  相关新闻
» 意法半导体新推出运算放大器 瞄准汽车和工业环境应用
» 见证IC产业前世今生 「IC积体电路特展」多元化呈现
» IEK: 台湾智慧制造生态系规模底定 加速半导体等关键产业应用扩散
» SEMICON Taiwan 2018国际半导体展暨IC60大师论坛即将登场
» 工研院AIoT!席卷产业新革命:智慧车辆


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK83SCU58SWSTACUKZ
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw