当你阅读音频行业杂志时,可能会很快得到这样的印象:对声音品质的追求意味着在扬声器、功放、播放器以及线缆方面的巨额投入。市场上数以千计的高端设备是否音质拔群,通常是由这些行业杂志的“金耳朵们”决断的。这种情况无疑与高端市场的定位有关。在高端市场中,相比于绝对的音质,听音偏好以及聆听体验更受关注。在这部分细分市场,产品往往以凸显开发者的想法为主,而非必须遵守客观的评价方法——即便官方通常自诩“音质中性且自然”。
但是对于大众市场的消费终端产品,又是何种情况呢?比如笔记本、电视机、投影仪、智能手机、耳机以及会议电话中集成的扬声器。当个人偏好在客观现实面前败下阵来(单纯是因为个人品味无法迎合庞大的消费群体),当迫于成本的压力不得不追求高产量以及高效的开发和生产时,对产品音质进行广泛的测试则成为了一道必要环节。工具化测量只能覆盖特定指标:如失真与噪声、频率响应、效率、最大声压级以及信道分离度等。
然而,音频质量的优劣不仅仅是由这些标准参数决定的。人类感知在评价声音与音质中的作用不可小觑。那么,如果不将与人相关的因素考虑其中,客观测试又如何能真实地反馈听音者的评价呢?
MDAQS助力打破困境
训练有素的听音者通常会主动且有意识地与声音打交道,比如能够注意到听音设备的连接方式或者听音环境声学特性不同引入的细微差异。但诸如“中高以及临场感频段内的动态出色,泛音丰富”等这类的声音特征并不是一般群体的有意识地评价声音的标准。一般群体对声音回放系统音质的感受是直观的、无意识的。在开发过程中,我们将一般群体称为“缺乏经验”的听众,此处的“缺乏经验”当然仅仅指声音评价这方面。
我们仔细筛选了没有听音经验的听音人员,进行了数百小时精心设计的听力测试。这些听音人员对海量的音乐以及多种类型的音频设备就几个维度进行了评价,然后将综合听音测试的结果作为训练MDAQS算法模型的基础。通过充分的验证,我们发现这些听音人员对音质的感知主要取决于三个质量维度:
- 音色:这里指的是频率响应与时间精度的影响。频谱是否忠实还原原始频谱?设备还原的音调有多自然?信号的时间精度是否得以保留?
- 沉浸感:沉浸式声场能够尽可能真实地“填满”(虚拟)空间。在听者周围的连续三维空间中,虚拟声源能表现得有多好?
- 失真:声音听起来“纯净”吗?面对电子和电声元件引入的负面影响,声音信号能否保真?
上述质量维度的加权评级确立了人们能感知到的音频设备的总体音质。
MDAQS使用经过精心训练过的指标对人类感知进行建模,以替代音频设备开发流程中测试听音人员的音频质量评估。
构成感知总体质量的三个维度,音色、沉浸感和失真是MDAQS评价工具中的重要要素– 事实上通过这三大要素足以进行大部分的评估,但MDAQS的评价指标也不是一成不变的,设置额外参数能进一步细化评价指标。毕竟,由于回放设备种类多样,音质的要求也不能一概而论。在任何使用场景下,MDAQS都能得出可靠的、全面的且有意义的结果,对任何类型产品的整体音频质量进行可重现与可比较的评估。
MDAQS模型有听音人员参与,且经过严格的执行和验证测试,已被证明在研发早期阶段是一种精准可靠的质量控制方法:客观评价指标与主观听音结果息息相关。