账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
多格式MP3播放器剖析
 

【作者: 誠君】2001年01月01日 星期一

浏览人次:【3914】

最近人们对MP3编码歌曲和播放器的兴趣,说明了音乐公司的业务模式正在快速发展和变革,其变革的动力是日益普及的因特网和电子商务。MP3和其他音频压缩格式,例如ACC、EPAC、WMA、Qdesign和AC3以及数字版权管理,都是用来保证音乐内容提供商的权益,并保护其音乐曲目不被盗版。



我们注意到MP3是基于MPEG1的Layer3音频标准(MPEG 1 Layer 3);AAC为先进音频编码标准(Advance Audio Coding,为MPEG2音频标准的一部份);QDMC为Qdesign的音乐编译码标准(Qdesign's Music CODEC);EPAC为Lucent的增强知觉音频编码(Enhanced Perceptual Audio Coder);WMA为微软的Windows媒体音频标准(Windows Media Audio)。



本文包括两部份。第一部份介绍了目前市场上几种主要的音频压缩技术。第二部份描述了播放器的硬件,并讨论安全数字音乐倡导者联盟(SDMI)所提出的数字版权管理(DRM)建议。



译码器基础


目前市面上流行许多人类听觉系统编码算法,它们达到了10至12倍压缩比,并保有CD的音质。这些编码器采用了知觉编码、频域编码、窗口切换和动态位分配四种关键技术来消除原始音频数据冗余和无关的内容。



知觉编码


知觉编码是藉由消除与人类听觉系统的无关数据来完成压缩。人的耳朵可看成是一种滤波器,其带宽从50Hz到5kHz。在此带宽内的听觉系统会表现出某些屏蔽特性,这种特性可用于数据压缩。当有一个强声音信号(屏蔽者)时,而同时又出现相对较弱的信号(被屏蔽者),并且两者在频域上很接近时,人耳将听不到后者。



如果两者只是在相近的不同带宽内,这种屏蔽效应将大大减弱。



根据经验可以得出一个屏蔽临界值。振幅值在临界值以下的信号将听不到,所以可以去除而不会影响声音质量。即使没有任何强信号屏蔽,小于静音临界值的声音也将无法听到,换句话说,这些声音也可以去除。我们同样注意到低频范围的屏蔽临界值比高频的斜率更大,也就是说,高频信号比低频信号更容易屏蔽。



另一种屏蔽现象为"时域屏蔽",这种现象为当一个强信号出现的前后时刻,也出现一个较弱的信号时,后者也会被屏蔽。然而,前向屏蔽(被屏蔽者在前)的有效时间范围要远小于后向屏蔽(屏蔽者在前)的范围。还有另外一种方法称为"噪音整形屏蔽",是将噪音编码再移到对音质影响最小的频率范围(图一)。




《图一 一个基本感知编码译码器》



频域编码


一种有效的消除冗余数据的方法是,将通常有很强相关性的时域数据变换到各元素几乎不相关的频域内。经常采用频率变换,产生一组相互几乎无关的频谱元素,来去除数据的冗余内容。这样做的好处是,将所得到的数据结构用来设计压缩算法比较便利,因为人类对声音的感知与其频率有关。根据所需的频率分辨率,可以采用变换编码或子带(subband)编码。



变换编码的频谱分辨率比较高,而子带编码的频谱分辨率通常较低。它们还可以结合成一个混合滤波器,在不同频率处有不同的分辨率,这样既简单又灵活。最简单的子带编码系统包括一组M型带通滤波器(分析滤波器)将输入信号分隔成M个子带,这些子带可以相互重迭,也可以不相互重迭。



每个滤波器的输出为10M,结果取样数等于输入取样数。进一步对输出结果进行处理,即可得到必要的压缩。在接收器(译码器)中,藉由填充零值来增大每个子带的取样率,直到它等于原信号取样率。然后再藉由合成滤波器来产生最终的重建输出。



变换编码系将一段采样值被线性变换成一组几乎互不相关的数据,称为变换系数。常见的变换有离散傅立叶变换(DFT)和离散余弦变换(DCT)。这些系数再根据人类心理声学模型来量化和压缩。



这类变换通常都有分块边界效应(有限长度对滤波器反应的限制),所以一般用"修正DCT(MDCT)"来计算它。MDCT采用50%重迭的连续分析块,如果不加量化的话就没有分块边界效应。如果有量化,由于子带重迭导致滤波器脉冲反应的加倍,所以边界效应也不明显。MDCT还有一个比DCT更高的变换编码增益和通带反应更好的基本序列,我们可以用混合方案在效率和分辨率之间达到良好的折衷。



窗口切换


频域编码的一个显著的现象是前向回波(pre-echoes)。例如,一段静止之后声音幅度的突然增大(attack)会导致量化误差增大。在变换编码和子带编码中,频域变换作业的整个分块都会有这个错误,这就导致回到时域之后,会出现声音前向回波。消除它的一种方法是将误差限制在一个较小的时间段内。



这样把声音的其它部份与前向回波分开,还能产生可屏蔽整个或部份前向回波的前向屏蔽效应。将误差限制在一个较小的时间段内,意味着采用更小的分块来进行频域变换。这种方法的缺点是需要更多的位数处理同样的数据,因为随着编码段数量的增加,需要更多的边带信息。我们需要调节窗口大小在位数和前向回波之间取得均衡。当信号稳定时需要更大的分块,信号有大幅突变而不稳时,就应该取较小的分块。



动态位分配


所有编码器的最终质量,大部份是决定于位在各个子带或系数之间的分配。为有效地分配位,必须不停地分析输入信号,并根据我们对人类听觉系统知识所建立的某些模型进行位分配。要将位分配到人类听觉最有效的区域,在人耳不敏感的区域就不用分配或只分配很少的编码位。



因为信号总是在不停变化的,人的听觉系统在不同的条件下,对信号的反应也不同。这样,我们就需要动态位分配技术。得到好的位分配的前提是:精确的人类感知声音模型。



典型的编码过程为:首先根据输入信号的特征将数据分割成数据块。然后藉由变换编码(DCT/MDCT)或子带编码或混合编码,将时域数据块变换到频域。接下来量化数据(每个量化器所需的位数,取决于所用的人类听觉系统模型),然后进行某种型式的熵编码,来消除符号冗余。数据流通常与数据头和各种边带及辅助信息同时进行,形成最终的数据流。译码过程为编码的逆向过程,但要简单得多,因为无须对人类心理声学模型进行分析。将声频数据从比特流提取出来,并藉由熵译码、去量化和频域到时域的变换,最后输出。



以上四种技术构成了市场上绝大多数编码器的基础(MP3、AAC、Qdesign、WMA和Dolby Digital)。这些编码的区别在于它们的使用方法。例如不同编码器有不同的心理声学模型、位分配、噪音整型和窗口切换技术。它们可能还包括一些改进的技术,例如利用立体声回放信道间冗余度的联合立体编码技术。



数字版权管理(DRM)


当前音乐发行产业主要被Sony、BMG、EMI、Universal和Time Warner五大巨头所垄断。数字音频播放器能否成功占有市场的一个关键因素是,能否买到音乐源。所以,音乐内容提供商就必须保证有一个安全的、没有盗版的数字音乐源供应管道。这正是安全数字音乐倡导者联盟(SDMI)发展的一种主要驱动力。



SDMI是由全世界的录音产品、消费性电子产品和信息技术产业所组成的一个论坛,目的是研究开发受到保护的数字音乐发行技术规范。换句话说,它将提高保护艺术家作品的可行性,以促进新的音乐相关贸易与技术发展。既要保护又要有限度的开放,是大多数内容提供商最关心的话题。



一个典型的音乐供应管道包含的控制点为(图二):




《图二 含有控制点的音乐发布系统》



1.源(可以是压缩也可是未压缩的)



2.主机(如一台PC)



3.可携式播放器和储存媒体。音频流从音乐源出发,藉由主机传送(如有必要可以压缩)到播放器或最终到储存媒体,媒体可以安装在终端机上,也可以是单机式(standalone)的。DRM保证了数据在这些控制点之间传送的安全性和合法性。



DRM方案中有三个重要的概念:



1.加密:加密是将一组数据进行扰码(scramble)的技术,这样除非知道扰码过程的密匙(secrete key),否则无法还原数据。在DRM方案中广泛采用加密技术,以保证各个控制点之间音乐源和重要数据不泄露。



通常一个下载过程中有多个密匙,每两个控制点之间通讯都有一个单独的密匙。下载过程结束后,一般要将这些密匙毁掉,以防止被黑客窃取。理想的DRM方案不仅应将被窃取的机会减至最小,而且应保证一旦密匙失窃,损失的范围最小,即只限于该过程、设备或媒介(media)。



2.加水印(water-print):当前加水印是指在现有音乐源信息内嵌入听不见的数据信息,包括版权方面信息,例如国际标准记录码、用户ID、使用守则和其它特许权的追踪信息。可以用DRM软件来防止对这些信息的非法拷贝和压缩。



3.连接(binding)连接是将歌曲与一个或多个设备或媒介联系在一起。基本意思是限制允许"播放媒介歌曲的设备数量"。例如:在某特定媒介上的一首歌,只能在被用户授权的几台播放器上播放。任何其它未被授权的播放器就无法播放。这样不仅避免了非法拷贝,而且减少非法侵入所造成的损害。



有了这三个基本工具,当在不同控制点之间传送数据时,DRM软件就可以防止非法侵入(藉由加密),非法拷贝(藉由水印和连接)。



前景展望


固态音频播放器能否取代CD播放器而成为主流,主要是取决于技术、商业和用户等多种因素,从业界对新的发行模式的接受程度、数字音乐源的可获得性、用户对新的购买模式的接受能力,到储存媒介的价格和新版本的保护限制等。其它可携式播放设备,例如PDA、手机和因特网浏灠器都整合了数字音响播放功能。



另一些压缩音频播放器如CD和MD,它们储存的是压缩数据流而不是PCM数据流。但有一点可以肯定,那就是数字化音乐播放前景广阔,它即使不能以可携式播放器的型式获得成功,也将以其它型式被市场接受。



相关文章
MP3音效质量设计考虑
剖析MEMS技术之消费性应用
低成本的MP3播放器系统整合技术
MP3 Player技术市场发展趋势
一个拥有加密系统的P2P传输软体 – MUTE
comments powered by Disqus
相关讨论
  相关新闻
» 瀚??引进智能家居系列产品上市 推进连网增速新趋势
» 工研院CES展後赋能科技创新 掌握AI产业链商机可期
» 国科会TTA偕新创团队挑战CES 2024 共创全球科技产业新纪元
» 圆展4K双镜头声音追踪摄影机获台湾精品银质奖
» 摩尔斯微电子与Xailient合作改变智慧型摄影机前景


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84O7FLMKASTACUKX
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw