账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
MPEG2音频编码技术简介
 

【作者: 誠君】2003年05月05日 星期一

浏览人次:【6872】

MPEG2是当今最为流行的AV压缩标准,可用于视频、音频和数字信息储存。完整的MPEG2标准可满足STB等广播应用和DVD或D-VHS、VCD等多媒体应用。MPEG2并非对MPEG2编码器进行标准化,而是为经过MPEG2编码的比特流提供了一种标准化格式,亦即它只规范编码后的标准格式,不规范MPEG2编码器内部的规格。另一方面,它也为MPEG2译码器提供了一个标准模式,规范MPEG2译码器的规格。


MPEG2标准的音频部份大致基于MPEG1标准,因此二者兼容性很强。这一点使得现有的MPEG1设备可对MPEG2信号中,兼容于MPEG1的部份信号进行译码;而MPEG2设备也可将MPEG1信号译码,从而实现前向兼容(forward compatible)。


表一 MPEG2标准的压缩分层
MPEG2层 压缩比 目标速率 容许速率 理想延迟 理论最小延迟
1 1:4 192Kbps 32-448Kbps <50ms 19ms
2 1:6 128Kbps 32-384Kbps 100ms 35ms
3 1:10 64Kbps 32-320Kbps 150ms 58ms

压缩分层

MPEG2和MPEG1音频压缩可分为三层;层数越高,压缩的程度、所需CPU处理能力以及声音质量也相对增加,而传输所需的带宽则相应减少,如(表一)。因此,第一层的压缩率最低、所需CPU处理能力最低、延迟也最少。由于压缩率最低同时声音质量最差,因此它所需的传输带宽最大。而第三层的声音质量最佳,压缩率可达1:10,处理时间也几乎是第一层的三倍。(表一)可清楚说明。


之所以将压缩分为三个层,一部份是基于需要,一部份则是历史原因。


首先,它取决于所压缩的信号将用于哪种应用中。例如,当我们主要希望能再现高质量的声音,其次才关注处理能力/成本,那么应选择第三层。而如果主要考虑的是处理能力和成本,则可选择第一层或第二层。不过,如果选用的不是第三层,则声音在重现时会有所欠缺,因此,用户必须权衡考虑,选择适合于其特殊应用的那一层。


其次,压缩层的概念是逐渐发展而来的。第三层规范比第一、二层定得晚。当第三层规范开始流行时,采用第一、二层规范的设备已十分普及,消费者也非常熟悉了。因此,必须让消费者能自由地选择适合自己应用的那一层规范。这与黑白电视和彩色电视的情况有些类似。彩色电视便可对黑白电视的信号进行译码。


《图一 Photobank Jukebox应用示意图》
《图一 Photobank Jukebox应用示意图》

MPEG2音频压缩及编码

三层规范的音频压缩及编码过程简述如后:首先,输入的音频信号到达滤波器组,它采用快速傅利叶变换(FFT),将时域采样转换成同样数目的频域采样。输出是一系列带宽相等的子带。心理声学模式过程计算每一子带的信号掩蔽比(SMR),以便决定每一子带可用于编码的信号位数。在信号位或噪音分配过程中,通过滤波器组的输出及SMR信息来决定每个子带可承受的量化噪音。量化噪音越高,这一子带所分配的信号位数就越低。在比特流格式化模块中,子带频率采样与分配给该层的信号位及一些其它信息相结合,形成一个音频讯框,这个讯框包括一个信号头和其它信息段。


MPEG2音频增强功能

与MPEG1相比,MPEG2在以下方面有所改善:


1.半采样率

在MPEG2中,仅需使用MPEG1中一半的采样率便可保持极佳的声音质量。这一点对评论频道、多语频道及多媒体等应用尤其有益,这些频道的频率范围为20Hz到20kHz,但极少使用。


2.多频道扩展

MPEG2支持5个音频信道,共同实现一种“环绕”立体声效果,以便获得更为逼真的立体声。这5个信道分别是左信道(L)、右信道(R)、中央信道(C)、左后环绕信道(Ls)和右后环绕信道(Rs)。这种情况下,在前面布置3个高音音箱,在后面布置2个,因此也可称为3/2立体声。


MPEG2音频编译码芯片

MPEG2音频编码可以单独或与MPEG2视频编码一起在硬件上实现。在后一种情况下需要增加多路再使用器或多路输出选择器,以进行相应的编码或译码;也可以采用一个编译码器来完成两个功能。通常MPEG2音频编码是通过DSP来实现的,这种方案成本更低而且更为灵活。MPEG2音频编译码器芯片电路方块图如(图一)所示。



《图二 MPEG2音频编译码芯片之应用》
《图二 MPEG2音频编译码芯片之应用》

许多电子设备厂商生产的MP3播放器中都有这一系统,并带有MPEG2音频第三层译码器。一些MP3播放器可储存约1~2小时的音乐,这种情况下通常储存在记忆棒或闪存中。带有硬盘的播放器则可储存更多信息。


如果要同时实现MPEG2音频和视频编码,则两种数据流的多路再使用是一个关键问题。可以在同一块芯片上进行音频和视频信号编码,也可以采用另一块芯片。这一过程是由ITU 13818-3标准控制,可选择使用程序流(program stream)或传输流(transport stream)。在多路再使用的情况下,MPEG2音频和视频信号共享带宽。除了音频和视频信号外,数据流中还携带了有关两种信号的合成信息。这种情况下,总比特率(也称为系统比特率)是音频和视频信号比特率以及数据头和字节填充的总和。


显然,视频部份占用了大部份带宽,当系统比特率高时,音频信号的比特率比视频信号或多路再使用数据流的比特率低。这种情况下,由于带宽十分丰富,因此用户可对音频流的各种参数进行设置以获得最佳的声音质量。但是,如果比特率较低,情况就不一样了。如果音频部份稍稍浪费一些带宽,视频部份的带宽便会不够用。最后解析出来的视频质量便会严重受损。在这种情况下应小心设置MPEG2音频参数。如将“音频PES调节”关闭,音频比特率也应该降低到192kbps或甚至128kbps。这些设置对改善MPEG2信息流解析质量十分有效。


结语

由于多媒体应用方兴未艾,整合音频和视频的MPEG2技术虽然有一段历史,但是它仍然是各种多媒体应用系统的主角,短期内,无任何新技术可取代它。国内有许多业者(大多集中在中和市远雄工业区和新竹市科学园区)长期耕耘影音应用领域,但是,能真正掌握MEPG2技术者寥寥无几,主要是因为MEPG2芯片技术长期被国外大厂把持,要突破的门坎很高之故。


最近有一种号称「五合一」能同时储存数字相机、MP3、手机、PDA、摄录像机的音频、视频信息之新产品,称作Photobank Jukebox,如(图二),它的储存量是20GB。此产品的市场需求量非常大,虽然有一定的技术门坎,但是值得国内业者努力开发。


相关文章
保护自动驾驶汽车(AV)控制电路
医比压压
CMOS影像感测器如何把手机变单眼
导入新音质设计技术的音讯处理器大幅提升空间表现
KUSO山寨机精选10+
comments powered by Disqus
相关讨论
  相关新闻
» 罗姆旗下SiCrystal与意法半导体扩大SiC晶圆供货协议
» 硕特THS系列产品跻身2023年度产品奖
» M31携手台积电5奈米制程 发表MIPI C/D PHY Combo IP
» 联发科发表3奈米天玑汽车座舱平台 推动汽车产业迈入AI时代
» 台法携手共推运动科技 瞄准奥运及新兴产业商机


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84TBM5NFOSTACUK0
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw