Dirac HD 详谈

Dirac HD Sound 是瑞典 Dirac 公司旗下的一项技术,被应用在魅族 MX3、OPPO Find 5、Find 7 等手机中。Dirac 公司宣称 Dirac HD Sound “并非是一种音效,而是 Hi-Fi 还原技术”,我之前写过文章简要谈过 Dirac HD Sound 的功能和可能实现的原理,但是文章表述不清,部分地方存在事实错误,略有误人子弟之嫌,现做补充修正。原文并未删除,但是不建议阅读。

首先,既然 Dirac HD Sound “不是音效”,为了说明白它为什么“不是音效”,就得先弄清楚什么“是音效”。SRS WOW HD(SRS Labs),PlayFX(Microsoft),BBE(BBE Sound),Beats Audio(Apple Inc),DFX(Power Technology),ClearBass(SONY),FullSound(PHILLIPS)……这些响当当的大名总该听说过吧,没有全听说过?至少听说过一部分吧!这些就是典型的音效。SRS WOW HD 改变了声场和低频,曾经在国产 MP3 上红过一时,配套的 PC 软件 SRS SandBox 一度也是破解版满天飞,这些年很少见了;PlayFX 从来都没有被微软拿到台面上说过事,不过这东西一直默默集成在 Windows 的自带声卡驱动中,但是一旦安装过 OEM 驱动,这个功能就会被覆盖掉,所以很少有用户接触到;BBE 曾经在 iAudio 的 MP3 上红了一阵,国内的酷比魔方有段时间跟进,但却险些砸了这个牌子,现在基本只能在音乐工作室见到了;Beats Audio 本来是 Beats 公司的一套音效,功能上像极了 SRS,一度集成到了惠普电脑和 HTC 手机上,如今被苹果全盘拿下,不知道未来的路怎么走;DFX 是十多年前非常流行的 Winamp DSP 插件,后来由于千千静听支持 Winamp DSP 插件也借机被国人所知,只是随着这两个老牌音频软件的陨落,如今也没了音讯;ClearBass 是索尼为旗下中低端 MP3 配套的低音补偿技术,可以有效增强低频量感的同时保证尽可能的不失真不爆音;FullSound 同理,也是飞利浦为低端 MP3 配备的音效,效果只能说一般般。就算是维基百科也没有为音效下一个定义(维基百科如今已经被墙),我就斗胆做一下这个工作:音效被我定义为“通过人为干预音频的波形来实现讨好主观听感的一种或多种技术组成的软、硬件套件”。而定义中得“讨好主观听感”其实没有几家做好了。

其次,什么是 Hi-Fi?这是个老生常谈的问题了。Hi-Fi 既不是定义又不是标准也不是音效更不是技术,事实上它只是个概念。Hi-Fi(High Fidelity)中文直译:“高保真”。高保真什么意思?字面意思!保真度高、还原度好,仅此而已。但是由于数字音乐从最初嗓子眼里出来到最终进入到你的耳朵要经过无数道工序(采样、剪辑、混音、后期、编码、解码、数模转换、放大……),用屁股都能想到最终的声音肯定和最初的千差万别。你说什么程度就叫做保真度高、还原度好了?没人来下这个定义。或许有一天王自如带着 Zealer 杀进耳机行业又弄出一套什么“数据化测评体系”,但是在此之前,Hi-Fi 只是一个泛泛的褒义词,没有实际意义。

那么 Dirac HD Sound 何以称自己“不是音效”?上面提到的这些音效有一个共同特点:无差别攻击。无论你用什么设备,用什么耳机,一律把低音值给你拉满。W4R?不管!IE8?拉满!Koss PP?轰死你跟我有什么关系?无论你用什么前端、不管你用什么耳机,一律按照我的套路来。不喜欢?卸载吧,我没办法。而说 Dirac HD Sound “不是音效”就是因为它并不是“格杀勿论”,而是“有的放矢”。Dirac HD Sound 通过对每一组“前端+耳机”的组合进行高精度声学分析,缺点便一目了然,再将前端输出的信号进行针对性修改(补偿),使其以最佳的匹配度输出到耳机上,以达到“最佳还原度”。将这个过程称之为“第二次调音”不为过,这就和所有传统音效都有所不同。

那么原理呢?由于细节问题是 Dirac 的商业机密,我也只能进行猜测,但是八九不离十。其整个过程极度类似于“用蜘蛛校色仪为显示器进行校色”,我们可以参考这个过程,来理解 Dirac HD Sound 偷偷摸摸都做了什么。Dirac 官方宣称 Dirac HD Sound 主要进行了三个方面的补偿:频响、相位、瞬态。我们就针对这三个方面,进行分析。

“频响”之于耳机就相当于“色准”之于显示器。“频率(Frequency)”是表示声音声调高低的单位,“响度(Volume)”是表示声音强弱的单位,“频响曲线”则是以频率和响度为坐标轴绘制的曲线。对于“Hi-Fi”这个定义来说,最理想的频响曲线就是在 20Hz 到 20KHz 之间做到完美水平,这就表示了该耳机在每个频率上发出的声音都是一样大的,也就是人们常说的所谓“三频均衡”。一条耳机的频响曲线如果跌宕起伏像过山车一样,也就注定了它跟 Hi-Fi 这个词基本没关系了。我们来回忆一下蜘蛛校色是什么原理:把校色仪贴到屏幕上,让屏幕显示各种颜色,校色仪采集这个颜色,并测出其和标准颜色的差距,用软件进行补偿——红色发绿,就从红色信号中减去相应量的绿色;白色偏蓝,就给白色信号中补上一定量的黄色,以此类推。Dirac HD Sound 在频响这一部分的处理手法很可能十分简单粗暴:画出你的频响曲线,哪里低了,补上来,哪里高了,压下去,直到与直线最接近为止。明眼人一看就懂,这不就是均衡器吗?的确,大体上是和均衡器差不多的,但是 Dirac HD Sound 的精度要比普通均衡器高很多,并且没有一般均衡器所拥有的一个问题:相位偏移。

“相位”是表示声音发出的时刻的一个概念,学过高中物理的人都知道,声音是由单条或多条正弦波组成的,而正弦波相互的相位差决定了声音是否同一时间发出、差多长时间。在用一般均衡器调节之后,声音很容易产生相位差,也就是说,本该同一时间发出的声音,因为均衡器的调节错位了——这就像极了显卡和显示器由于配合不完善产生了画面撕裂,而克服画面撕裂的技术叫做“垂直同步”,通过锁定最高刷新率来避免图像的“相位差”。Dirac HD Sound 也有自己的一套算法是的即使调节了各频段波形的强度后,依然能保持相位不变,应该同时发出的声音依然同时发出,这其中的黑科技原理我就猜不到了。但是就像垂直同步能保持画面完整不撕裂一样,Dirac HD Sound 同样能有技术保证本该同时响起的声音同时响起。

“瞬态”这个东西说起来玄学更大了。什么叫瞬态?电路中的电信号瞬间的起伏所引起的电路元件的反应叫做“瞬态响应”,放到耳机领域,就是看耳机能不能处理瞬间起伏的音乐。瞬态好的耳机,鼓点拳拳到肉,声音干净利落;瞬态不好的耳机,感觉拖泥带水,声音乱七八糟。这像极了 LCD 显示器的“拖影”。为什么会有拖影?上一个时刻的信号走了,下一个时刻的信号来了,但是液晶分子还在意犹未尽得显示着上一个信号,这就造成了拖影。对于耳机来说,道理相同:上一个信号走了,振膜还意犹未尽,下一个信号来了,两者混在一起。显示器是如何避免拖影的?通过对信号更加极端的处理方式:在换路的瞬间给电路一个更极端反向的电压,中和拖影效果。早年 AMD 催化剂控制中心的Display OverDrive 和后来诺基亚手机屏幕上的 PureMotion HD+ 都是利用这种原理来中和“拖影”。那么我猜测 Dirac HD Sound 对于耳机瞬态的优化应该与此类似,都是在信号切换的瞬间给予瞬时过量反量。

我以上的所有内容都只是针对耳机来说的,而事实上如果不考虑前端的特性,对耳机胡乱适配一通,也是不科学的。Dirac HD Sound 最大的优点是“针对性”,这个针对性不止是针对耳机,也是针对前端,因此Dirac官方喜欢称自己为“对整个音频系统的优化”,这种说法并不过分,毕竟对于耳机输出来说,整个“音频系统”也就只有前端和耳机两部分。Dirac 中国官方微博的一篇文章的解释非常有趣:你要给眼睛配眼镜,得知道眼睛的情况。

不只如此,Dirac HD Sound 既然有能力把一条耳机调整到“尽量高保真”,也就可以把一条耳机调整到“某一种风格”。就比如小米手机里内置的“米音”(其实就是把 Dirac HD Sound 改了个名字,强烈鄙视这种拿别人技术贴自己牌子的行为),在针对小米活塞耳机适配时,就应小米公司的要求,调音出了动刺大刺的声音,味道很诡异。在 Dirac 中国官方微博给我的回复中,他如是说道:由此可见,哪怕是同样采用了 Dirac HD Sound 技术来调音,客户的审美和品位也会直接决定最终适配的效果。

发布者:王跃琨

Digital Asshat

留下评论

发表评论

%d 博主赞过: