為了在不損害隱私的情況下實現音訊感測,美國卡內基美隆大學的研究人員開發了一種名為「剪紙」(Kirigami)的裝置端過濾器,可以在音訊感測器收集到人類語音片段後,於用於活動辨識之前將其檢測並刪除。
這項技術可以安裝在各種帶有麥克風的感測器上,在數據離開感測器之前過濾語音,從而保護人們的隱私。
許多現有的音訊感測隱私保護技術都涉及改變或轉換數據,例如排除音頻頻譜中的某些頻率,或訓練電腦忽略人類語音。但目前智慧音箱等裝置會優先考慮實用性而非隱私的設備,實際上可以竊聽人們說的一切。
而研究人員設計出一個輕量級的過濾器,即使在最小、最便宜的微控制器上也能運行。該過濾器可以識別並移除可能的語音內容,這樣敏感數據就不會離開設備。
該過濾器的工作原理是一個簡單的二元分類器,判斷音訊中是否存在語音。研究團隊透過實證分析基於深度學習的自動語音辨識模型洩漏的語音內容辨識率來設計該過濾器。
「剪紙」還可以透過可配置的閾值來平衡其積極移除可能語音內容的程度。使用較高的閾值時,過濾器優先移除語音,但也可能剪掉一些對其他應用程式有用的非語音音訊。使用較低的閾值時,過濾器允許更多環境和活動聲音通過,以提高應用程式的價值,但也增加了某些語音相關內容通過感測器的風險。
研究人員目前正在探索活動感測的許多有用應用。例如使用音訊感測來提醒失智症患者日常任務、監測患有注意力缺陷過動症的兒童的行為異常,以及評估學生的憂鬱症跡象。