CEVA推出以神經網路為基礎的語音辨識技術WhisPro,此一技術將以語音應用為目標。WhisPro是一種隨時聆聽的多觸發片語技術(multi-trigger phrase technology),讓新式的智慧手機、智慧音箱、耳塞式藍牙耳機和其他語音設備的使用者可與雲端語音助理服務互動,如亞馬遜Alexa、谷歌助理、百度DuerOS等。
WhisPro與CEVA的ClearVox前端語音處理軟體技術協同工作,為客戶提供功能強大並且以CEVA DSP為基礎之硬體和軟體解決方案,用於語音辨識。這種語音預處理和神經網路演算法的整體整合,提供超過百分之九十五的高辨識率,同時消耗最少的運算資源和功率。
在近場和遠場(far field)使用案例的嘈雜環境中,此一技術亦具備出色的適應性;在邊緣設備上,WhisPro技術在本地端運行,無需雲備份,從而保護用戶的隱私並以最小延遲提供即時回應。
CEVA技術長Erez Bar-Niv表示:「在智慧設備革命中,語音已經迅速成為首選的人機界面,但卻是實施時最複雜的技術之一。在設計WhisPro時,我們充分利用了我們的低功耗DSP核心以及公司內部的降噪和回聲消除演算法。WhisPro支援以邊緣和雲端為基礎的語音助理服務,還可讓客戶使用自己的專有觸發片語來控制他們的設備。」
以語音AI技術為基礎並專門針對邊緣設備進行最佳化的WhisPro可擴展遞迴神經網路 (Recurrent Neural Network)技術可同時辨識多個觸發片語。WhisPro SDKit為客戶提供了在其系統中整合和測試WhisPro技術的指引和工具。根據客戶要求,WhisPro可以支援多個關鍵字和多種語言的發音,現在可支援英語發音,將於短期內支援華語發音。