MP3音频压缩编码 历史
MP3格式开始于1980年代中期(1987),在德国Erlangen的Fraunhofer研究所开始的,研究致力于高质量、低数据率的声音编码。在Dieter Seitzer-个德国大学教授的帮助下,1989年,Fraunhofer在德国被获准取得了MP3的专利权,几年后这项技术被提交到国际标准组织(ISO),整合进入了MPEG-1标准。
最早的播放器是Frauenhofer在1990年早期开发的,但他只是一个非常不知名的小程序,没有引起大家的重视。而被大家公认的第一个Mp3播放器是在1997年,由一个叫做Tomislav Uzelac的开发者开发的。他开发了AMP MP3 播放引擎。当AMP引擎进入网络以后不久, 几个大学生Justin Frankel 和Dmitry Boldyrev拿到了Amp引擎,并且为他添加了一个Windows界面,最后他们把这个程序命名为"Winamp."
在1998年,当Winamp作为免费的音乐播放器在网络上传播的时候,Mp3的狂潮开始了。许许多多的爱好者在网络上交换有版权的音乐mp3。
MP3格式是一个让音乐界产生巨大震动的一个声音格式。MP3的全称是Moving Picture Experts Group, Audio Layer III,它所使用的技术是在VCD(MPEG-1)的音频压缩技术上发展出的第三代,而不是MPEG-3。MP3是一种音频压缩的国际技术标准。
MP3格式可以使音乐文件在音乐质量做很小牺牲的情况下将文件大小缩小很多。MP3文件能以不同的比率压缩,但是压缩的越多,声音质量下降的也越多。标准的MP3压缩比是10:1,一个三分钟长的音乐文件压缩后大约是4 MB。
MPEG代表的是MPEG活动影音压缩标准,MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层。MPEG频文件根据压缩质量和编码复杂程度的不同可分为三层(MPEG AUDIO LAYER 1/2/3分别与MP1。MP2和MP3这三种声音文件相对应MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3的压缩率则高达10:1-12:1,也就是说一分钟CD音质的音乐未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。因此,目前INTERNET上的音乐格式以MP3最为常见。
其实音频压缩技术很多,MP3压缩技术并不是最好的。不过,我挑来捡去,最终还是选择了它。其中一个主要是因为Lame编码(版本3.89BETA,内含RazorLame114图形界面)可以使用不同压缩比率(bitrate)保存各种较高质量的声音文件,而MP3的音质高低与编码软件的优劣有直接关系.。另外,MP3受到广泛支持,通用性好,有移动随身听MP3播放设备,各种软件工具较多。因此,所有的语音、音乐等音频资料文件全部采用MP3压缩格式保存,参数:采样频率44.1kHz,采样精度16位,压缩比率128kbps,立体声。这种高质量的参数便于以后编辑处理,而其它各种数字音频则根据不同要求用相关软件再进行处理,但是原始文件质量一定要留有备份且品质要高,因为各种压缩格式都是有损压缩,无法复原。
音乐信号中有许多冗余成分,其中包括间隔和一些人耳分辨不出的信息(如混杂在较强背景中的弱信号)。CD声音不经压缩,采用44.1kHz的固定速率采样,可以保证最大动态音乐的良好再现,当然,信息量较少处的数据量也是相同的,因而存在压缩的可能性。音响频宽为20~20kHz(顶级CDPlayer可向下延伸至2Hz)已成为目前的音乐标准。MP3为降低声音失真采取了名为"感官编码技术"的编码算法:编码时先对音频文件进行频谱分析然,然后用过滤器率掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。虽然他是一种有损压缩,但是它的最大优势是一极小的声音失真换来了较高的压缩比。
MP3采用与杜比AC-3相似的变压缩比率(VBR)压缩技术,采样的压缩比率依音乐中信息多寡,并利用人耳的掩蔽效应来减少冗余数据。经过MP3编解码后,尽管还原的信号与原信号不完全一致,仪器实测的指标也不高,但主观听音效果却基本未受影响,而数据量却大大减少,只有原来的1/10~1/12,约1MB/分钟,也就是说,一张650M的CD盘可容纳超过10小时的CD音质的音乐(44.1kHz,16bit)。换句话说,采用44.1kHz的取样率,MP3的压缩比例能够达到1:10~1:12,而基本上拥有近似CD的音质。1分钟无压缩的CD音乐转换成文件需要10MB的存储空间,如果压缩成MP3文件只需要1MB就够了。
MP3音乐的制作原理--说得简单些,将音频文件压缩成MP3文件,其实就是利用MP3编码器找到并删除音频文件中人耳听不到的声音。正常的人耳只能听到频率在20赫兹至2万赫兹的声音,音频文件中包含的一些声音可能超出了人耳所能听到的范围,另外还有一些细微的声音可能被更大的声音掩盖,还有一些音乐中的声音可能根本就是多余的。编码软件能将代表这类声音的文件找出来并加以删除。这样,原先臃肿的音频文件就变小了。压缩音乐文件时,人们通常会说以多大的压缩比率进行压缩,压缩比率的单位为Kbps(千字节/秒)。当选择较高的压缩比率时(如128Kbps),原始文件中被去除的数据将会比较少,音质比较好,但压缩后的文件比较大,有时会导致文件无法使用;相反,当选择的压缩比率较低时(如64Kbps),被去除的数据会比较多,这样做虽然缩小了文件,但却会造成音质损失。就是因为这一原因,当前的MP3音乐在发展中遇到了瓶颈(MP3格式无法在缩小文件大小的同时保证音质)。
从音乐品质方面来看,由于MP3是采用1:10的数字压缩格式,在64kbs压缩率下,标准的MP3过滤掉了10kHz以上的声音来节省空间,以减小文件尺寸,但是音乐的细节部分特别是高频会受到损耗,所以,在听感上仍无法和采用传统模拟技术的磁带以及采用无损编码方式的CD唱片相媲美。但是,MP3问世不久,就凭这较高的压缩比12:1和较好的音质创造了一个全新的音乐领域,MP3编码器,制作器,播放器铺天盖地。我们周围更是出现了各种歌手的MP3全集,甚至有MP3搜索引擎帮助搜索各种MP3。然而MP3的开放性却最终不可避免的导致了版权之争。Napster的出现更是让MP3的风暴到达的顶峰。当然音乐界对这些"侵权"行为岂能座视不理?于是运用法律进行了围剿,IT界最有名的事件之一恐怕就是Napster侵权案的败诉了。
MP3播放机一般采用内置FLASH存储器或外插FLASH卡,容量一般在16~64M,约可存储15~60分钟的CD音质的音乐,或是数倍于此的语音信号(如有声读物等)。它与其它可重写媒介相比具有很大的优势,如:无活动部件、读取速度快、体积小、抗冲击、操作省电等等。MP3播放器存储介质的价格比较昂贵,占据整机价格中的相当大部分,所以存储容量的大小直接影响产品的价格。
压缩比率(bitrate):在音频压缩编/码过程中表示声音数据压缩大小的度量单位,指每秒声音数据在音频压缩文件中所占平均位数,单位是kb/s或者kbps。
压缩比率与所再现声音质量的关系(一般要好一些)
8 kbps ----- 2.5 kHz (普通电话音质)
16 kbps----- 4.5 kHz (短波收音机音质)
32 kbps----- 7.5 kHz (AM调幅收音机音质)
64 kbps----- 11 kHz (FM调频收音机音质,采样频率22050Hz)
128 kbps---- 16 kHz (接近CD唱盘音质,采样频率32000Hz/44100Hz)
网友评论