首页 > 资讯列表 > win10 >> win10

站搜网学院:文件格式系列科普之MP3

win10 2017-07-28 19:33:10 转载来源: IThome

各位,好久不见。每个人的想法和意见都应该被尊重,因为个别读者的挖苦和不理解而停更原生站搜网学院,是个非常不理智的决定

各位,好久不见。

每个人的想法和意见都应该被尊重,因为个别读者的挖苦和不理解而停更原生站搜学院,是个非常不理智的决定。经过一段时间的调整,文轩已经平复心情,带着原生站搜网学院回来了。

小编希望用最简单最浅显的语言来解释复杂的原理,然而小编不是万能的神,要为大家普及相关的知识,小编也需要不断地学习。学习这些知识的渠道有很多,比如查阅维基百科、技术博客,还有相关论坛。需要说明的是,站搜网绝不会对这些站点中的内容进行直接的抄袭和照搬,学习和理解新知是个非常麻烦的过程,小编希望麻烦自己,方便大家。

下面我们开始。

1887年,爱迪生发明了留声机,使得人类存储和复现声音信息成为可能。

上世纪80年代,索尼推出了Walkman系列袖珍卡带播放器,让卡式录音带的流行更加广泛。

同在上世纪80年代,在索尼与飞利浦的共同努力下,CD逐渐成为取代卡式录音带的音乐存储介质。

上世纪90年代,一种数字音频编码和有损压缩格式被确立,这就是今天站搜网学院的主角——MP3

什么是PCM

PCM,全称为Pulse-code modulation,翻译成中文是脉冲编码调制,其目的是把模拟信号转化为数字信号,在转化的过程中,PCM会将原始的信号波形按照同等的间距分割成段并采样,然后通过数字来对其进行量化。

这样说大家可能难以直观感受,我们来举个例子。

▲图片来源:维基百科

如图所示,这是一个正弦波,PCM的过程就是将这个正弦波(红色曲线)以采样点(蓝色的点)分成长度相等的段,再采取每个采样点的数据,在这个例子中容易看出,我们采取到的数据是8、9、11、13、14、15、15、15、14、13、12、10、8、7、5、3、2、1、0、0、0、1、2、4、6和7。这些数据还可以进一步进行编码和处理。

经过脉冲编码调制的数字信号,可以通过一系列的算法还原为模拟信号,我们称之为解调,不过在PCM的过程中,我们隔一段距离才采样一次,有很多数据并没有被采集进来,因此,经过调制-解调的信号和原始的模拟信号只是相近,并不相同(这种采样是有损的)。

MP3的采样率

通过上文,我们简单了解了PCM,MP3的采样原理正是如此。在将原始的声音波形信号转化为数字信号的过程中,需要确定每次采样的时间间隔,MP3的采样频率通常是32000次/秒、44100次/秒和48000次/秒,我们称之为采样率,单位是kHz,这三个采样频率,转换成标准单位就是32kHz、44.1kHz和48kHz,MP3的采样率以44.1kHz居多,采样率越低,MP3的音质就越差。

MP3的比特率

通过上文我们得知,采样率,指的是每秒钟从原始的波形信号中采集多少次信息,而比特率,指的则是经过压缩之后,每秒钟的音频数据需要用多少个比特来表示。

大家知道,在互联网的时代,无论是传输图像、传输视频还是传输声音,大家都希望越快越好,而要达到“快”的目的,就需要两手抓,第一,抓网速,当文件的大小恒定,网速越快,文件传输得就越快,第二,抓文件本身的体积。当网速恒定,文件越小,传输的速度就越快。MP3格式被广泛采用,就是因为它大大减少了音频的数据量,使得音频在网络上的传输又快又方便。

它之所以能够减少音频的数据量,是因为它舍弃掉了一些PCM数据,人的耳朵对声音频率的感知能力是有限的,而原始的音频中,可能包含一些人耳不易察觉、或者人耳根本听不到的声音信号,因此在PCM之后,MP3会把这些对人耳来说根本不重要的数据扔掉,对普通人来讲,这些数据扔掉与不扔掉,听起来并没有显著差别。这和JPEG量化时舍弃图片中人眼难以辨别的画面细节的做法颇为相似。

在采样率恒定的情况下,采到的样本被扔掉的数据越多,每秒钟的音频数据就越少,也就占用越少的比特,被扔掉的数据越少,每秒钟的音频数据就越多,也就占用越多的比特,MP3的比特率在32kbit/s(也可写作kbps)到320kbit/s(也可写作kbps)之间,也就是说,MP3每秒包含的数据的比特数在32000到320000之间,通常情况下,我们听到的大多数MP3,比特率在128kbps到320kbps之间。比特率越低,MP3的音质就越差。

简化冗余数据

除了间隔采样和舍弃数据外,通过霍夫曼编码简化冗余数据也是减少音频的数据量的重要手段,在介绍JPEG压缩原理的文章中,我们已经介绍了霍夫曼编码,感兴趣的同学请移步该篇文章,感谢霍夫曼老爷子,为简化冗余数据提供了数学理论基础,如果给我再来一次的机会,我一定好好学习数学。

MP3文件里的ID3标签

除了音频数据,MP3文件里还有一些其他的数据,声明MP3的歌曲名、艺术家、所属专辑等,这些数据被称为ID3标签,ID3标签通常占用MP3文件开头或结尾的若干字节。

随着时代的发展,ID3标签演进出了不同的版本,ID3v1最多支持128个字节长度,可以存储歌曲名、艺术家、所属专辑、年份、评论、该首音乐在专辑中的曲目和艺术类型。如果你嫌ID3v1中包含的信息太少,还可以在ID3v1的标签前面加上长度为227个字节的扩展标签,扩展标签支持更长的歌曲名、艺术家名和专辑名,并且额外支持曲速、开始时间和结束时间的表示。

ID3v2虽然延续了ID3v1的名称,不过结构和ID3v1截然不同,ID3v2有v2.2、v2.3和cv2.4三种版本,它里面包含的信息和ID3v1相比,犹如大海之于湖泊,它不仅可以包含ID3v1中的所有信息,还可包含MP3的版权信息、作词者、作曲者、作者URL甚至专辑封面等等。

MP3的未来

MP3对音乐数字化的贡献居功至伟,然而随着时代的发展,我们可能要看着MP3退出历史舞台了。

MP3的开发者们不久前表示,相比于MP3,AAC的效率更高,而且随着互联网互联网技术的发展,我们的网速越来越快,人们可能不再满足于有损音频格式了,下载一首FLAC或者APE格式的高解析度音乐,可能并不比下载一首MP3音乐多花太多的时间,以后我们在下载音乐时,可能MP3真的不是首选了。

总有一天,MP3格式会被其他的音频格式取代,不过短时间内,MP3还不会马上消亡,毕竟很多数字音乐分发站点主要提供的音乐格式仍是MP3,对网友们来讲,MP3几乎是数字音乐的象征,这种音频格式已经深入人心。

时代在发展,科技在进步,虽然MP3终将退出历史舞台,不过我们亲眼见证了MP3的繁荣,能够成长在这个时代,幸甚至哉。

标签: 站搜 学院 文件 格式 系列 科普 MP3


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持