大卫.沧浪 发表于 2012-10-2 10:38:18

【音频知识二】WAV APE FLAC CD 原盘 刻录盘

本帖最后由 大卫 于 2012-10-2 10:47 编辑

WAV APE FLAC CD 原盘 刻录盘 到底谁是最好的?

一、声音的标准是什么?
很多乱七八糟的文章都会给人这么一个误区,就是声音是有标准的。所以才有人说出 “至今还没有哪个软件敢说可以作为一个音频的官方鉴定标准的” 这样不知所谓的话。
首先,大多数判断音频文件是否是无损的逻辑其实很简单。CD(PCM)在设计的时候音频上限是 22.05khz,这些软件就自己定义一个上限,比如 20khz,如果在音频中找到了 20khz 以上的声音就猜测它是无损的。当然还可有有下限测试。

事实是,声音是没有标准的。从来没有过哪个组织站出来说,他们定义的声音(音频)就是标准。因为声音是个模拟的东西,没办法标准化。

那么 CD 是什么呢?PCM 是什么呢?

声音是模拟化的,于是人们开始用一种方式用数字的形式将声音表达出来。所以就有了 PCM 编码。然后就开始有人莫名其妙的将 PCM编码(CD)信奉为标准。其实 PCM 编码已经是有损的了,因为他也将 22.05khz 以上的声音都砍掉了。

二、CD 和 WAV 的区别是什么呢?

CD 和 WAV 都是使用 PCM 编码的。于是又有人跳出来反复强调 CD 到 WAV 一定会有损失的!⋯⋯ 还是先说说的区别的。

电脑里面任何一个文件和设备都要用合适的方式来告诉电脑,“我是什么”。所以有一部分内容是用来描述自己的。而 CD 也首先要描述自己-“我是一个光盘,我是一张音频CD光盘”。我们粗略的称这种信息为 “头信息”。而 WAV 也包含自己的头信息。最大的一点区别是, CD 必须声明自己是一个硬件(有介质的物体,就像硬盘一样),然后计算机才知道用哪种方式来读取 CD 里面的数据--PCM编码过的音频数据。如果你了解硬盘的文件系统,这就很好理解了。硬盘必须现有文件系统(NTFS、FAT32),才能存储数据。计算机也必须知道硬盘的文件系统,然后才能知道如何存放数据。不同的文件系统,存放的方式是不同的。

三、CD 到 WAV 会损失数据

每一个提出这个观点的人,都相当的肯定,但是从来没有人说过会损失什么数据,为什么会损失数据。
音频从模拟化到数字化之后,CD上所有的内容就是0和1,你可以想象成CD上有无数个点,有些点是凹下去的,有些是平的。永远只存在2个状态“凹”和“平”。
你们把搞计算机的想的太白痴了!几十年都过去了,连从光盘到硬盘的数据复制都做不出来??现在无数的高清电影从网络复制的,一部片子就是十几个G。我们连个700M以内的文件都复制不过来?你从光盘上拷贝一个 rar 包能不出错的拷贝过来,你拷贝一段音乐,就是死活会出错?一定要丢失一点东西心里才舒服是不是?

EAC 是干什么的?EAC 就是用来确保从光盘到硬盘读取完全正确。EAC通过多种方式来校验数据是否读取正确。如果 EAC 发现有地方读取不到,或者是他通过算法纠正出来的数据,EAC 会在 log(日志)里面反馈给你。这也是为什么网络上流传的 APE Flac 等等都要包含一个 log 文件,log 文件里面包含了这次抓取的所有信息,一目了然。

四、WAV 到 Flac 或者 WAV 到 APE 是无损的

PCM(WAV) 是一种编码,Flac 也是一种编码,APE 也是一种编码。他们可以相互转换,但是很多人都理解成,Flac 和 APE 是基于 WAV 的。这是错误的。他们都是对声音的一种编码方式,他们都能达到一样的参数--双声道 20hz-22.05khz。但是他们之间在逻辑上没有绝对的依存关系。实际上 APE 和 FLAC 是一种比 PCM 更先进的编码方式。他们的体积小。
当然,不可否认的是 Flac 和 APE 都提供了 从 PCM 到自己格式的转换。

我还是把我另外一篇帖子的一部分贴出来吧,这里面有二进制层面的比较。Lossless: The encoding of audio (PCM) data incurs no loss of information, and the decoded audio is bit-for-bit identical to what went into the encoder. Each frame contains a 16-bit CRC of the frame data for detecting transmission errors. The integrity of the audio data is further insured by storing an MD5 signature of the original unencoded audio data in the file header, which can be compared against later during decoding or testing.
我简单的翻译一下:
针对 PCM 的数据编码是不丢失任何信息的,并且在解码环节也是完全一致的(作者特别强调 bit-for-bit 意思是每个字节都是完全一致的!)。每一个帧都会包含一个 16-bit 的CRC校验来确保数据在传输的过程中不会出现错误。(帧的概念:每一秒的音频数据会被分成很多份,其中每一份叫做一帧。这里作者是强调每一小片数据有机制保证它的完整性)。并且,最终现成的数据通过在数据包头部添加 md5 签名来保证数据完整性。(这是强调最终的文件也有机制保证数据完整性)

这里强调一下!flac 和 ape 从来没有说过 会对声音的某个频段做删除处理,一定有人跳出来说:“你有什么证据说他们没有删除”。所以我预先先回答了,没有哪个人会傻到去找证据证明他没有做什么事情。所以写楼顶文章的作者,莫名其妙、毫无根据的说数据被删除了,这才是需要拿出论据的。

4. 接下来我来做一个小实验。方法是这样的,找一个原始的 wav 音频数据。然后用 flac 对它进行压缩,然后再用 flac 对它解压缩。然后通过 md5um 来比较他们的 hash 数值是否一样。如果你想详细了解 md5 ,建议看这里
我简单的说一下 md5sum,md5sum 可以达到的效果是,两个不同文件产生出来的 hash 数值绝对是不一样的。用这个方式是为了击破楼顶说 flac 解码的时候往数据里面冲0,来保证大小一样的可笑观点。你们有兴趣自己做实验的,可以自己创建2个文本,一个是内容是 00,一个是 11, 他们的大小是一样的,但是他们的 md5sum 是绝对不同的。如果你再把第二个文件改成 00,你会发现他们的 md5sum 一样了。这几乎是 eMule ed2k hash 原理是一样的,两个不同的文件产生的 ed2k 连接是绝对不同的。而同一个文件,无论你怎么拷贝怎么改名,ed2k 连接都是一样的。
所以只有两个相同的文件才会有一样的 md5sum。

下面我把我编码,解码,比较文件的过程帖上来:
1.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ ls
2.P1000589.JPG                        P1000593.JPG                        P1000596.JPG                        张学友 - 爱与交响曲.cue                专辑介绍.rtf
3.P1000591.JPG                        P1000595.JPG                        P1000599.JPG                        张学友 - 爱与交响曲.wav                爱与交响曲.log
4.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ flac -0 张学友\ -\ 爱与交响曲.wav 1.flac
5.
6.flac 1.2.1, Copyright (C) 2000,2001,2002,2003,2004,2005,2006,2007Josh Coalson
7.flac comes with ABSOLUTELY NO WARRANTY.This is free software, and you are
8.welcome to redistribute it under certain conditions.Type `flac' for details.
9.
10.张学友 - 爱与交响曲.wav: wrote 349727312 bytes, ratio=0.619
11.ERROR: can't open input file 1.flac: No such file or directory
12.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ ls
13.P1000589.JPG                              P1000595.JPG                              张学友 - 爱与交响曲.cue                        专辑介绍.rtf
14.P1000591.JPG                              P1000596.JPG                              张学友 - 爱与交响曲.flac                爱与交响曲.log
15.P1000593.JPG                              P1000599.JPG                              张学友 - 爱与交响曲.wav
16.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ mv 张学友\ -\ 爱与交响曲.flac 1.flac
17.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ flac -d 1.flac
18.
19.flac 1.2.1, Copyright (C) 2000,2001,2002,2003,2004,2005,2006,2007Josh Coalson
20.flac comes with ABSOLUTELY NO WARRANTY.This is free software, and you are
21.welcome to redistribute it under certain conditions.Type `flac' for details.
22.
23.1.flac: done
24.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ md5sum 1.wav
25.616312bb438e1025e76da82e5214f21a1.wav
26.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$ md5sum 张学友\ -\ 爱与交响曲.wav
27.616312bb438e1025e76da82e5214f21a张学友 - 爱与交响曲.wav
28.YuanmatoMacBook-Air:广东音像出版社出版 环球发行《张学友—爱与交响曲》 latteye$


复制代码
可以看到最终的 md5sum 是完全一样的。这就说明两个wav文件在二进制层面是一模一样的。
强调一下:所谓二进制层面的比较,就是在硬盘上每一个点的0和1都是一模一样的。做到这种程度,居然还有人能说出 “你这只是表面的东西”。那我真的担心你到底知不知道你天天面对的电脑到底是个什么东西。可能对你来说,电脑只是一个盒子里面放着一个吹风机罢了。
五、刻录的内容和原盘一样么?

这个问题也时常有人讨论。答案是不一样。原因是 jitter。

我们把刻录光驱想象成是一个工人,这个工人要做的事情是在一个纸上画点。那么他画出来的每张纸肯定是不一样的。很可能第一张纸,头两个点距离是1毫米,而另外一张纸头两个点的距离是 1.0000001毫米。这就叫 jitter 也就是抖动。
激光头也是一样的,他没办法在物理层面上(注意不是逻辑层面),做到两张盘一模一样。

那么再从刻录盘压缩成 APE,和原来的 APE 一样么?答案是一样的。
因为从逻辑层面看,一个点还是一个点,尽管偏了那么一点点,但他不会变成两个点。而计算机只关心你有没有点。不在乎你这些点是否有些距离误差。

那么两张原盘的音质一样么?一样的!
原盘不是刻录机做的,你理解成是复印机复印的,所以是一样的。当然真实情况还要复杂很多,压盘的模版会有寿命问题,所以很多人追求“首版”。

六、刻录盘在CD机上放效果和原盘一样么?

我不知道!因为这里面有一个未知因素我没研究过。

首先,刻录盘和原盘是不同的。于是就有一个理论,是 jitter 影响了音质。
这个理论很容易让人赞同,因为原盘一个音和下一个音如果间隔 0.01s,而你刻录盘可能会间隔 0.0101s。听起来可能就会不同。

但是,我个人觉得。现在的 CD 机已经和多年前不同了。用过 PC CD光驱的人都知道 CD-ROM 有32x 48x 52x,这种倍速。这个倍速其实就是基于 CD音频的读取速度来的。也就是说 1x 就是能够流畅读取 CD 音频的速度。
那么,现在的 CD光驱早就有技术可以做到 52x,对于现在到的设备来说,先读出来,再去泡杯咖啡,然后再交给下面的解码设备去处理的时间都有了。他有充足的时间将这些数据重新排序,来稳定他们的位置,从而放出来。

另外一方面 内存 也老早用在 CD 机里面了。几年前很多松下和Sony的 CD随身听,都可以剧烈的晃动播放器。但是时间不能长,我以前有一台松下的,大概能晃动 15秒。超过15秒声音就不对了。这其实就是播放器先把内存填满了,然后再开始播放。当你晃动的时候,激光头是读不到数据了,但是内存里面还有数据,照样可以播放。但是内存的一旦放完了,还是照样卡壳。

所以 jitter 对于最终的声音是否有影响,我不知道。理论上我判断不出来,我个人觉得也没必要判断。因为我是 PC-Hi-Fi 呵呵。


以上的6点内容,前5点不需要讨论,也没啥好讨论的。因为计算机原理就是这样的。本子里写着1,你非说你打开看可能会变成2,我没兴趣浪费这时间和你讨论这种问题。
当然,如果有超出我知识之外的东西,造成我理解错误,欢迎指出。不过这种讨论可能就涉及更细节的内容,PCM rfc?⋯⋯ 呵呵。

最后给大家一个概念,计算机是人做的,在计算机领域并不存在太多的似是而非的东西。模拟化的音频确实存在很多模糊的东西,但是我们现在接触的都已经是数字化的存储了。
下接【八、何谓黑胶唱片】


大卫.沧浪 发表于 2012-10-2 10:46:08

八、何谓黑胶唱片
      黑胶唱片又称LPCD采用二进制数字式01的记录方式,决定了其记录的内容与模拟录音的母带有了本质性的差异。与母带相比,任何一段录音的信息量缺失都是必然的。就如一个模特与她的画像,就算画功如何之真切,也只是像真,并不是同一事物。   而黑胶基本采用模拟的记录形式,与模拟录音母带所记录的内容是一致的,差别在于转录过程中的母带与器材传输的损耗。就如同一人在不同时间内摆同一个姿势一样,是真实的重现。   CD取代黑胶是在于商业社会买卖的规律。生产CD所需的成本估计就是塑料那几分钱,而运输占体积小,随便卖几十元,唱花了碟也不会跳线,利润的惊人和消费者的接受性和可负担性都是显而易见的。黑胶大批量生产光压铜模就已经有每张碟几元的成本了,还没计算聚乙烯原材料的成本,运输又重又占地方,保存不好又容易损耗跳线,也卖几十元的话,恐怕赚头不大且消费者购买意欲不高。相比之下,黑胶必然在主流市场上被CD取代。      音质上,CD噪音小,信噪比大,也就是黑胶所谓的“爆豆声”在CD上是绝迹的。   而其他方面,我不愿比较。原因只有一个,CD因为不是原声,于是录音可经过音质的处理、随意放大减小甚至修改;黑胶是原声,经过剪接和信噪比调较,甚至早期立体声头版和一些母带直录,只剪接,不作其他修改,录音的效果是如何,黑胶就很忠实地记录下来。   如果有人要用所谓同一个录音的CD和黑胶来比较,那或者应用一个比喻:这是一个整容美女和一个原装女人的较量,你喜欢哪个?释随尊便了。    黑胶和CD保存的比较   CD在制作上,塑料上镀上铝或其他金属,通常在20年甚至更短的时间内,金属膜在光的作用下开始氧化直至彻底穿孔报废。   黑胶保存上,只要不受热受压,竖立放置,又不播放的话,基本无任何损耗。不怕光不怕水,随手拿出一张黑胶唱片都有可能比你我老。

页: [1]
查看完整版本: 【音频知识二】WAV APE FLAC CD 原盘 刻录盘