细节同样重要 常用有损音频编码特点

PChome | 编辑: 宋华飞 2014-02-11 06:30:00原创 返回原文

MP3问世至今已经有20余年的历史了,除了MP3之外,Vorbis、Opus和WMA也是比较热门的几种有损编码,小编将在文中带来这几种有损编码的介绍。

细节同样重要 常用有损音频编码序言

[PChome电脑之家音频频道原创]MP3编码的出现可以说是对整个音频行业产生了重大的影响,众所周知,MP3是一种有损音频编码,在压缩时它舍弃了PCM数据当中对人类听觉不重要的部分,从而达到了非常小的文件体积,凡事有得必有失,MP3在解码/解压缩时无法100%还原到和原始PCM数据相同,会产生一定的失真,当MP3采用小码率/比特率压缩时,其失真会非常明显,甚至会对听感产生直接的影响。MP3问世至今已经拥有20余年的历史了,到了今天使用量依旧非常大,但整个行业在如此长的一段时间内可没有吃老本,后起之秀可谓是层出不穷,但普及率和大众认知度却都不如MP3。

可能有不少Hi-Fi发烧友会收藏不少CD和无损音频,认为有损音频毫无用处,但事实上有损音频的用途还是很大的,就目前国内的网速来说传输动辄上百兆或是几十兆的无损音频还是颇为吃力的,这时一种出色的有损编码就成了很好的解决方案,即使是苛求细节的APPLE也在iTunes当中提供了大量有损音频,当然iTunes出售的可不是MP3编码的音频而是AAC编码的,据说是由母带直接压缩得到的,其音质足以媲美CD,实际上,高码率的AAC编码音频平时在手机等移动设备当中使用则是完全够听了,和无损音频几乎是无法区分的。

Apple iTunes

除了上文提及的AAC和MP3编码外,Vorbis、Opus和WMA也算是比较热门的几种有损编码,小编将在本文当中为各位网友带来这五种有损编码特点及优势的介绍,如果完全通过文字表述肯定是会不够直观、太过枯燥的,所以本次小编还使用了频谱来让网友能有直观的了解到各种有损编码在压缩效率方面的优劣,究竟各种有损编码是舍弃了PCM音源当中的哪些数据来做到如此大的压缩比的,对其感兴趣的网友不妨可以关注下本文。

欢迎提供建议,如有任何与音频的相关问题,可以向我们发帖提问:

PCHOME声卡/耳机/音箱区论坛

更多精彩的最新键鼠外设资讯,请点击进入音频频道

文件格式参数 有损音频编码的小知识

在正式开始之前,各位网友先来了解下媒体压缩方面的一些小知识,大家在硬盘当中看到的音频文件一定是和图片上的形式是一样的,文件图标、文件名以及拓展名,通常来说,不少网友是通过拓展名来区分文件格式的,事实上多媒体文件是大有乾坤的,使用多媒体文件信息查看软件MediaInfo后我们就能更进一步的看到音频文件的详细信息了,即使文件使用了错误的拓展名MediaInfo也能识破真身。

小编电脑当中的音频文件

多媒体文件格式是相当重要的一环,MediaInfo相信当中的概要就是文件格式信息,不同的多媒体编码需要使用相应的文件格式来封装成一个文件,文件格式通常也称作容器,对于视频文件来说一个文件内往往会封装多条轨道,单一的音频文件也可能会封装有多条音频轨道,在播放时播放器会通过读取二进制文件头来判断文件究竟是哪种格式、内部是哪种编码,为播放做好准备,打个不是非常恰当的比方,我们可以把文件格式理解成一种储物容器,例如衣橱、碗柜之类的,相应的容器存储不同的物品,正常情况下,衣橱中会存放衣物、碗柜当中摆放碗筷,不同容器用途不同,而这些放入容器当中的物品就是音频、多媒体数据文件。

使用MediaInfo查看音频文件详细信息

对多媒体文件存储结构有了大致了解之后再回过头来稍稍了解下MediaInfo当中一些重要的参数,这里小编就引用一点百科当中的描述了,码率即比特率是单位时间播放连续的媒体如压缩后的音频或视频的比特数量,相当带宽消耗量或吞吐量。码率模式通常有三种CBR、ABR、VBR,CBR是固定码率模式,该模式下单位时间内的码率是恒定不变的,ABR为平均码率模式,和CBR不同,它是允许码率存在一定变化的以适应音频不同部分不同复杂程度的需求,而VBR是目前最实用最优秀的一种,可变码率模式则是让码率大范围波动,但由于存在码率波动用于网络传输时可能会出现延迟的情况。采样率定义了每秒从连续信号中提取并组成离散信号的采样个数,CD音源采样率44.1KHz、DVD是48KHz,位深则是每个采样所使用的数据量,位深越大音频保真度越高,CD中使用16bit位深。

上图是WAV格式文件头的二进制字节定义,不同字节定义了不同的属性内容,软件可通过文件头可知道文件内部数据的属性(来源于网络)

优劣如何判断 频谱图及编码软件介绍

在本次介绍当中除了上页提及的一些参数外,为了能更直观的让网友看到不同音频编码的压缩能力及特点,小编还简单的使用了音频频谱图,第一次接触到它的网友说不定会觉得无从入手,但实际上频谱图也是很好理解的,横轴代表时间,纵轴代表频率,亮度则是代表了声音的强度,通过频谱图可以看出其基频及泛音,也可以用来分析乐器的起音、衰减、延音及释音等,通过压缩后的频谱和压缩前的PCM频谱进行对比我们即可看出音频在编码压缩时究竟是损失了哪些数据。

本次使用到的20Hz-20KHz的线性扫频信号

本次使用到的音频文件PCM音源频谱

下图是压缩音频时使用的各种软件及编码器,由于不同编码器在设计和开发上是有所不同的,所以小编就分别针对不同编码器采用了不同设置,使各种编码器均能达到比较出色的压缩效果,在烧友当中使用非常频繁的foobar2000可拓展性相当出色,小编通过foobar2000调用了大部分的命令行编码器,压缩MP3、AAC、Vorbis、Opus都是通过它进行的。

拓展功能丰富的foobar2000

通过foobar2000可非常方便的调用各类命令行编码器

通过Microsoft Expression Encoder压缩WMA

战斗力很持久 MP3编码特点介绍及功劳

说到MP3就不得不提及红极一时的Winamp,Winamp全盛时期也可以说是MP3的鼎盛时期,当时PC的硬盘可不像现在动辄就有几个TB,网速也和现在无法比拟的,想从互联网上直接下载无损那是天方夜谭,正是MP3小巧的体积加上Winamp出色的性能才使得很多人能够在PC上享受音乐所带来的美妙体验。

Winamp播放软件界面

MP3全称是MPEG-2 Audio Layer III是MPEG的一个标准,于1991年被标准化,MP3最大可支持比特率320Kbps、2声道、位深16bit和48KHz的采样率,在达到最高比特率时音质与CD非常接近,在当时来看这已经是相当厉害的一个标准,但将其放在多声道应用颇多的今天似乎是有些力不从心了,MP3最令人诟病的一个方面就是它对高频支持不佳,在压缩时它会舍弃一些较高频率的音频数据,从频谱图上来看高频部分完全被截断了,并且还出现了爆音,虽然MP3有不少不足之处,但一个经过良好优化开发的MP3编码器仍能够提供出色的质量,例如lame等。

经MP3编码压缩后的频谱

相对于PCM音源的失真之处

私有豪门出生 微软WMA编码特征及优劣

WMA编码是微软的亲儿子,是微软私有编码,WMA的打头字母W正是Windows的缩写,毋庸置疑,WMA在Windows平台下默认官方支持的,但Apple iTunes也随后跟进了,WMA支持MP3的很多特性,细节方面改进颇多,例如Windows Media Audio Professional规格可支持最大7.1声道的音频。WMA9还有Windows Media Audio 9 Lossless规格可支持5.1声道的无损压缩。

Windows Media Player 12界面截图

由于WMA是私有编码,不经授权第三方是无法使用WMA编码从事商业活动的,此外WMA在特性方面比较注重版权保护,自WMA7之后开始支持证书加密,如果用户没有获得证书授权,在本机上是无法播放被加密后的内容的。从频谱上来看压缩效果,WMA依旧是舍弃了不少高频部分,频谱高频部分完全是被削平了,提亮差异后发现似乎音频还有些许细节数据被丢去,小编觉得使用wma主要优势是能够兼容任何微软自家的平台、设备,如果不是为了兼容性还是不建议网友过多使用的。

经WMA编码压缩后的频谱

被提亮后的差异之处

两款开放编码 Vorbis、Opus特点优势

Vorbis和Opus都是开放编码,任何人都可使用,没有专利或限制。Vorbis编码也可以叫ogg,由Xiph.Org基金会所开发,作为MP3的竞争者,关系有点类似于Windows和Linux,在多声道支持、技术细节方面优于MP3,但硬件支持偏少,目前Vorbis最大的使用者是Google旗下的最大视频网站,其提供WebM格式的视频内使用的正是Vorbis,从Vorbis的频谱上来看,压缩效率也是非常不错的,保留了绝大部分的高频,仅仅是损失了小部分,但缺乏广泛的支持是它最大的遗憾。

经Vorbis编码压缩后的频谱

被提亮后的差异之处,仅有小部分高频丢失

Opus也是开放编码,由互联网工程任务组(IETF)所开发,最初版本在2012年9月制定,主要用于网络音频的实时传输,Opus低延迟是最大的优势,最低可达5ms,小编使用foobar2000自带的编码器编码后发现Opus的压缩效率似乎不尽如人意,谐波非常多,Opus推出至今相当短,无论是硬件支持还是软件方面都需要进一步的发展。

经Opus编码压缩后的频谱

被提亮后的差异之处,谐波非常明显

出色的继任者 AAC编码效率高优势明显

AAC(Advanced Audio Coding)和前辈MP3一样同样是属于MPEG的标准,最早出现于1997年,由杜比实验室、AT&T、Sony等多家公司联合开发,直至2006年之前AAC使用量一直不多,但目前AAC普及度已经很高了,很多设备都能够默认支持,AAC常见的后缀名有m4a、mp4、aac等,m4a由于Apple在iTunes当中的使用现在成了主流格式。

Apple iTunes中的音乐使用了AAC编码

就AAC的近几年的发展情况来看,成为MP3的替代者似乎是毫无悬念了,相较于MP3,AAC支持多达48个音轨,15个低频(LFE)音轨,5.1声道,96kHz采样率和最大32bit位深,远超MP3和CD的标准,此外AAC还有9个规格(Profile)可适应不同的应用环境,例如AAC LD(Low Delay)和AAC HE(High Efficiency)非常适合应用于网络传输。

经AAC编码压缩后的频谱

这不是全白的,大家不妨可以仔细观察一下,和PCM差异非常之小

AAC在实战表现方面确实相当出色,小编使用AAC压缩了一段PCM音频,得到的结果和音源非常接见,如果没有加亮差异之处几乎完全看不出不同之处,高频完全得到了保留,听感方面也是和PCM音源几乎是无法分辨的。

还需正确选择 常用有损音频编码总结

想必各位网友看了上文的介绍后对各种有损音频编码的特点和优势有一些了解了,毫无疑问,综合各方面因素来说和MP3同门的AAC编码是胜出者,无论编码规格还是压缩效率都是明显优于其他编码的,无愧于Advanced这一词,至于兼容性方面,大力提倡的Apple设备自然不在话下,此外,索尼Walkman、微软Zune等设备播放AAC也是毫无压力的,甚至PSP和任天堂的DSi、3DS游戏机都是在支持之列,近几年的Android手机更不用说了,软件方面,微软的Windows系统从Vista开始就默认支持,Linux则是可以通过MPlayer等软件播放,小编觉得AAC在不久的将来完全取代MP3编码那是毫无疑问的,MP3作为诞生20余年的技术来说确实是该进入历史的长河了。

逐渐淡出人们视野的磁带

最后小编还有些小细节要与各位网友分享,一般情况下是不建议将一种有损格式转换成另一种有损格式的,即使AAC编码颇为出色也没有必要把手头上的MP3转换成AAC的,这样做是不会带来音质提升,只会将有损编码原有的失真进一步扩大,反而还会降低被转换后的音质,除非是遇到了硬件兼容问题才不得已进行转码,但如果手头上有不少CD或是无损音源需要转换有损编码这时AAC就是首选,转换后的音频相比MP3音质上肯定使有不少优势的。

欢迎提供建议,如有任何与音频的相关问题,可以向我们发帖提问:

PCHOME声卡/耳机/音箱区论坛

更多精彩的最新键鼠外设资讯,请点击进入音频频道

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑