以前我们做声纹辨识,是将人的声音频号转换成声谱图(spectrogram),从声谱图上观察说话人发音的特征,利用这些特征进行说话人的辨识,就像是利用指纹图形比对来认人一样,因此我们将经由声音来认人这样的过程,就说成是声纹辨识。其实现在的计算机已经有足够的能力,利用图像处理方式进行指纹的自动辨识,同样的,计算机也能够以语音处理技术作说话人的辨识(speaker recognition)。
虽说每个人的说话声音不太相同,对于熟识的朋友,通常听到声音就可以知道是谁,但是要做正确的辨识,却不太容易,因为声音的变量很多。例如一个人感冒了,这时候说话的声音就跟平常说话的声音不一样。我们也常常看到一些模仿名人说话的表演,相当逼真,若不是看到表演者,还真的以为是该名人本尊在说话呢。所以相对于指纹辨识,声纹辨识要困难多了,这也是为什么声纹辨识在使用上远少于指纹辨识。目前市面上可以看到一些按指纹输入作门禁管制的系统,但还极少看到只以声音输入作门禁管制的系统,在影片上看到的例子也常是配合指纹辨识或掌纹辨识一起使用,当作多一道验证程序。
随着计算机网络与无线通信的广泛使用,许多时候我们想透过手机去取得信息,按键操作不是最有效率的做法,因为用语音输入会更方便。如果要取用的信息是机密性的个人资料,就必须经过授权才可以进入系统,因此用户身份的确认便成为一个必要的步骤。可预期的,以声音做身份验证将会是未来极为需要的一项技术,但是要能克服辨识过程中可能对语音造成干扰的因素,例如说话人的变音、别人的模仿、噪音的干扰、信道造成的失真,以及编码传输时对于原始声音特征的破坏。
...
...
另一名雇主 |
限られたニュース |
文章閱讀限制 |
出版品優惠 |
一般訪客 |
10/ごとに 30 日間 |
5//ごとに 30 日間 |
付费下载 |
VIP会员 |
无限制 |
20/ごとに 30 日間 |
付费下载 |