mp3技术白皮书:音频格式全解析
mp3的技术虽然现在已经完全公开,但是,其具体的技术细节还是有一定的深度,因此此次小编对某些技术进行深度解释,希望网友们笑纳。
采样率:
数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的,实现这个步骤使用的设备是模/数转换器(a/d)它以每秒上万次的速率对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。
将一串的样本连接起来,就可以描述一段声波了,把每一秒钟所采样的数目称为采样频率或采率,单位为hz(赫兹)。采样频率越高所能描述的声波频率就越高。 对于每个采样系统均会分配一定存储位(bit数)来表达声波的声波振幅状态,称之为采样分辩率或采样精度,每增加一个bit,表达声波振幅的状态数就翻一翻,并且增加6db的动态范围态,即6db的动态范围,一个2bit的数码音频系统表达千种状态,即12db的动态范围,以此类推。如果继续增加bit数则采样精度就将以非常快的速度提高,可以计算出16bit能够表达65536种状态,对应,96db 而20bit可以表达1048576种状态,对应120db。24bit可以表达多达16777216种状态。对应144db的动态范围,采样精度越高,声波的还原就越细腻。(注:动态范围是指声音从最弱到最强的变化范围)人耳的听觉范围通常是20hz~20khz。
根据奈魁斯特(nyquist)采样定理,用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形,因此一个数码录音波的休样频率直接关系到它的最高还原频率指标例如,用44.1khz的采样频率进行采样,则可还原最高为22.05khz的频率-----这个值略高于人耳的听觉极限,(注: 可录md,例r900的取样频率为44.1khz并且有取样频率转换器,可将输入的32khz/44.1khz/48khz转换为该机的标准取样频率44.1khz的还原频率足已记示和真实再现世界上所有人再能辩的声音了,所以cd音频的采样规格定义为16bit。44khz, 即使在最理想的环境下用现实生活中几乎不可能制造的高精密电子元器件真实地实现了16bit的录音,仍然会受到滤波和声特定位等问题的困扰,人们还是能察觉出一些微小的失真所以很多专业数码音频系统已经使用18bit甚至24bit 进行录音和回放了。
现有的采样方式:
mp3:mp3的全称应为mpeg1 layer-3音频文件,mpeg(moving picture experts group)在汉语中译为活动图像专家组,特指活动影音压缩标准,mpeg音频文件是mpeg1标准中的声音部分,也叫mpeg音频层,它根据压缩质量和编码复杂程度划分为三层,即layer-1、layer2、layer3,且分别对应mp1、mp2、mp3这三种声音文件,并根据不同的用途,使用不同层次的编码。mpeg音频编码的层次越高,编码器越复杂,压缩率也越高,mp1和mp2的压缩率分别为4:1和6:1-8:1,而mp3的压缩率则高达10:1-12:1,也就是说,一分钟cd音质的音乐,未经压缩需要10mb的存储空间,而经过mp3压缩编码后只有1mb左右。不过mp3对音频信号采用的是有损压缩方式,为了降低声音失真度,mp3采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。(另mp3pro:mp3pro编码器将音频的录音分成两个部分:mp3部分和pro部分。mp3部分分析低频段(low frequency band)信息,并将其编码成通常的mp3文件数据流。这就使得编码器能够集中编码更少的有用信息,获得更佳品质的编码效果。同时,这也保证了mp3pro文件同老的mp3播放器的兼容性。pro部分分析的则是高频段(high frequency band)信息,并将其编码成mp3数据流的一部分,而这些通常在老的mp3解码器里是被忽略的。新的mp3pro解码器会有效地利用这部分数据流,将两段(高频段和低频段)合并起来产生完全的音频带,达到增强音质的效果。)
wma:wma就是windows media audio编码后的文件格式,由微软开发,wma针对的不是单机市场,是网络!竞争对手就是网络媒体市场中著名的real networks。微软声称,在只有64kbps的码率情况下,wma可以达到接近cd的音质。和以往的编码不同,wma支持防复制功能,她支持通过windows media rights manager 加入保护,可以限制播放时间和播放次数甚至于播放的机器等等。wma支持流技术,即一边读一边播放,因此wma可以很轻松的实现在线广播,由于是微软的杰作,因此,微软在windows中加入了对wma的支持,wma有着优秀的技术特征,在微软的大力推广下,这种格式被越来越多的人所接受。
wav:这是一种古老的音频文件格式,由微软开发。wav是一种文件格式,符合 piff resource interchange file format规范。所有的wav都有一个文件头,这个文件头音频流的编码参数。wav对音频流的编码没有硬性规定,除了pcm之外,还有几乎所有支持acm规范的编码都可以为wav的音频流进行编码。很多朋友没有这个概念,我们拿avi做个示范,因为avi和wav在文件结构上是非常相似的,不过avi多了一个视频流而已。我们接触到的avi有很多种,因此我们经常需要安装一些decode才能观看一些avi,我们接触到比较多的divx就是一种视频编码,avi可以采用divx编码来压缩视频流,当然也可以使用其他的编码压缩。同样,wav也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被pcm编码处理的wav,但这不表示wav只能使用pcm编码,mp3编码同样也可以运用在wav中,和avi一样,只要安装好了相应的decode,就可以欣赏这些wav了。在windows平台下,基于pcm编码的wav是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,wav也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于pcm编码的wav被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如mp3转换成wma。
ogg vorbis :号称mp3杀手!ogg vorbis究竟什么来头呢?ogg是一个庞大的多媒体开发计划的项目名称,将涉及视频音频等方面的编码开发。整个ogg项目计划的目的就是向任何人提供完全免费多媒体编码方案!ogg的信念就是:open!free!vorbis这个词汇是特里·普拉特柴特的幻想小说《small gods》中的一个花花公子人物名。这个词汇成为了ogg项目中音频编码的正式命名。目前vorbis已经开发成功,并且开发出了编码器。ogg vorbis是高质量的音频编码方案,官方数据显示:ogg vorbis可以在相对较低的数据速率下实现比mp3更好的音质!ogg vorbis这种编码也远比90年代开发成功的mp3先进,她可以支持多声道,这意味着什么?这意味着ogg vorbis在sacd、dtscd、dvd audio抓轨软件(目前这种软件还没有)的支持下,可以对所有的声道进行编码,而不是mp3只能编码2个声道。多声道音乐的兴起,给音乐欣赏带来了革命性的变化,尤其在欣赏交响时,会带来更多临场感。这场革命性的变化是mp3无法适应的。和mp3一样,ogg vorbis是一种灵活开放的音频编码,能够在编码方案已经固定下来后还能对音质进行明显的调节和新算法的改良。因此,它的声音质量将会越来越好,和mp3相似,ogg vorbis更像一个音频编码框架,可以不断导入新技术逐步完善。和mp3一样,ogg也支持vbr。
ra:ra就是realaudio格式,这是各位网虫接触得非常多的一种格式,大部分音乐网站的在线试听都是采用了realaudio,这种格式完全针对的就是网络上的媒体市场,支持非常丰富的功能。最大的闪烁点就是这种格式可以根据听众的带宽来控制自己的码率,在保证流畅的前提下尽可能提高音质。ra可以支持多种音频编码,包括atrac3。和wma一样,ra不但都支持边读边放,也同样支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的欣赏方式。这对唱片公司和唱片销售公司很重要,在各方的大力推广下,ra和wma是目前互联网上,用于在线试听最多的音频媒体格式。
ape:ape是monkey's audio提供的一种无损压缩格式。monkey's audio提供了winamp的插件支持,因此这就意味着压缩后的文件不再是单纯的压缩格式,而是和mp3一样可以播放的音频文件格式。这种格式的压缩比远低于其他格式,但能够做到真正无损,因此获得了不少发烧用户的青睐。在现有不少无损压缩方案种,ape是一种有着突出性能的格式,令人满意的压缩比以及飞快的压缩速度,成为了不少朋友私下交流发烧音乐的唯一选择。
acc:aac(高级音频编码技术,advanced audio coding)是杜比实验室为音乐社区提供的技术。aac号称「最大能容纳48通道的音轨,采样率达96 khz,并且在320kbps的数据速率下能为5.1声道音乐节目提供相当于itu-r广播的品质」。和mp3比起来,它的音质比较好,也能够节省大约30%的储存空间与带宽。它是遵循mpeg-2的规格所开发的技术。
atrac 3/atrac 3 plus:atrac3(adaptivetransformacousticcoding3)由日本索尼公司开发,是md所采用的atrac的升级版,其压缩率(约为atrac的2倍)和音质均与mp3相当。压缩原理包括同时掩蔽、时效掩蔽和等响度曲线等,与mp3大致相同。atrac3的版权保护功能采用的是openmg。目前,对应atrac3的便携式播放机主要是索尼公司自己的产品。不过,该公司已于2000年2月与富士通、日立、nec、rohm、三洋和ti等半导体制造商签署了制造并销售atrac3用lsi的专利许可协议。
真假4K充斥着眼球 一文教你如何辨别真假4K
为什么建议你开一个电子签名钥匙盘?电信设备进网许可证办理
因新型肺炎 苹果临时关闭中国Apple Store零售店
大气压平板等离子体反应器及其技术难点是什么
三星这二十五年:巨头成长记
MP3技术白皮书:音频格式全解析
安防监控领域高级嵌入式分析系统解析
领跑 AI 时代,开放原子开发者大会——2023 龙蜥操作系统大会圆满举办
AD7879控制器支持电阻式触摸屏上的手势识别
阀门锁的优势是什么,它又是如何充分体现优势的
国产ADC可100%兼容AD7192用于电子秤系统
eSIM技术对物联网的重要性
基于一种去中心化的博彩平台Augur介绍
领唐:物联网技术中的佼佼者
明确图像处理检测任务选择合适的工业相机
在UVM中component之间如何通信呢?
看懂EMC整改知识:原来竟然如此简单!(上)
电脑主板元件认识视频
一文详细了解荣耀Earbuds 3 Pro耳机
微软推送Win10新版:有何独特之处?要如何升级?