
图一 : Arduino官方销售9欧元的语音识别引擎(图片来源:Arduino官网) |
|
许多创客(maker)在使用Arduino进行创作开发时通常会用到各种函式库(library,对岸直接翻译成一个字:库),例如为了能操控伺服马达需要使用servo函式库,为了能操控步进马达需要使用stepper函式库,或者要使用SPI传输介面、使用感测器等也都需要使用对应的函式库。
这些函式库有些在安装完Arduino IDE後就已经随附内建,有些则需要使用者额外手动操作以便进行连线下载安装,或更原始的作法是手动下载、手动安装等,但印象中函式库的下载使用都不用付费。基本功能的函式库确实如此,但若是开发者花费许多心力才完成的函式库则可能要付费才能使用。
Arduino推出语音识别引擎
过往以来Arduino官方多半只销售硬体开发板或相关的硬体配件,软体通常免费提供,而近期Arduino特别与Cyberon公司合作,运用Cyberon公司的开发技术推出Arduino官方版的语音识别引擎(Arduino Speech Recognition Engine,其实就是函式库),并在Arduino官网上销售,一套9欧元。
Arduino推出Arduino Speech Recognition Engine(以下暂时简称ASRE)是为了Arduino Pro领域而推的,言下之意是用於产业应用,产业应用有相对高标的功能要求,也相对较愿意付费使用。
ASRE有许多特点,首先它是预先训练成的人工智慧/机器学习(AI/ML)模型,付费取得後立即可用,不再需要自行训练,同时只要简单的文字输入就能对命令(command)进行组态配置;其次是它可以识别多个唤醒字词(wake-up word)、识别命令的连续性等;三是已经支援40多种语言,且不受语气、腔调囗音的影响。
四是一种组态配置就能用於多个喇叭(或称扬声器、音箱)也是不用重新训练;五是适用於吵杂环境,此点对於产业应用特别需要,产业应用可能在户外、可能在工厂,环境背景噪音难以控制;六是直接在现场就进行识别推论,不再需要连线到後端,借助其他软硬体协助推论。
ASRE是运用Cyberon公司的技术但针对Arduino而开发调整而成,自然能够支援现有Arduino的相关软硬体。在硬体方面,ASRE支援多款Arduino开发板,包含Portenta H7、Arduino Nano RP2040 Connect、Arduino Nano 33 BLE Sense Rev2等;在软体方面,ASRE自然支援最常使用的Arduino IDE,但除此之外也支援命令列方式操作的Arduino CLI。
虽然要付费,但其实还是有免费体验版,体验版必须先到Cyberon官网上,输入个人的E-Mail、已经购买的Arduino开发板类型(前述三者之一)以及开发板的序号等才能取得免费体验版,体验版与付费版的识别正确性一致,但识别次数与触发模式的时间有别,免费版只能识别50次,付费版则无限制;免费版在触发模式时会延迟20秒时间才触发,付费版则没有延迟。另外要注意的是,付费版付费之後毕竟就已取得正式软体,而软体是可以任意拷贝、复制的,所以不合用也不允许退费。

图二 : 免费版(Free Trial)与付费版(Cyberon License)的差异比较(图片来源:Arduino官网) |
|

图三 : 语音识别引擎目前支援三种Arduino官方板卡(图片来源:Cyberon官网) |
|
小结
进一步的,Arduino官方已经帮ASRE设想数种使用情境,例如厂房里头因为搬运而腾不出手时的语音呼叫操作,或用於建筑物自动化相关应用,或是资讯服务亭(kiosk)、自动贩卖机、自动锁、医院的智慧病床或是紧急呼叫系统等。
最後提醒两点,一是ASRE布建模型不允许客制,但付费购买是可以用来产生新模型;二是软体授权是把处理器核心Cortex-M4/M7与Cortex-M0分开的,前者适用於Portenta H7跟Nano 33 BLE Sense两片板子,後者只适用於 Arduino Nano RP2040 Connect一片板子,两者恐无法互通使用。
(本文由VMAKER授权转载;连结原文网址)
延伸阅读
[1]语音识别引擎官方网页
https://www.arduino.cc/pro/software-speech-recognition-engine
[2]申请免费体验版网页
https://tool.cyberon.com.tw/ArduinoDSpotterAuth/CTMain.php
[3]ASRE官方销售网页
https://store.arduino.cc/products/speech-recognition-engine?variant=42904193204375