厂商要多努力，才能让用户听起来毫不费力？（上）_测试行业动态_

Part.01

为什么会听得费劲？

说到通讯质量，大家可能第一时间会想到语音质量，进而联想到POLQA、TMOS这些语音质量分析方法。但其实语音质量本身不能完全代表通讯质量或实际的通讯体验，它只是通讯质量的一个方面。在安静场景下，语音质量本身与通讯质量的直接关联性很高。但是在某些场景下则不然，比如：

在运行的地铁上
在行驶在高速上的汽车里
在演唱会现场
在KTV包厢里

这些都是生活中常见的一些强噪声场景。当你身处其中，在使用手机、耳机进行通讯时，即便使出洪荒之力也难以听清对方语音。这是因为虽然本身传递过来的语音信号质量可能很高，但由于语音被周围噪声所掩盖，通讯质量也就变得不尽人意了。所谓“通讯（communication）”，即双方能够听清楚对方发送过来的语音，并在此基础上得以继续进行沟通。在这种情况下，只有能相对轻松地听明白对方的语音，才算是令人满意的通讯质量。因此，仅评价语音质量是远远不够的，我们需要更有针对性的评价方法。

为此，人们引入了聆听努力度（Listening Effort）这个概念，并给出了详细分级与对应的描述：

数值	描述
5（最佳）	可以完全放松；不用尽力听
4	需要集中注意力；但不用太尽力听
3	需要适当地尽力去听
2	需要非常尽力地去听
1（最差）	再怎么努力都无法听懂句子的含义

表格 1 聆听努力度的分级

从上图不难看出，聆听努力度是从人的感受出发，以听明白为条件，是在达成这个条件的前提下人所需要付出的“代价”，也就是这里的努力度。通俗来说就是听明白传递来的语音信号吃不吃力，同样最终是听明白了，但下面两种体验对于用户来说可谓大相径庭：

并非所有内容都听清楚了，还个别字眼还得靠猜，但能够理解大部分意思，通讯可以继续（聆听努力度得分不佳）
所有内容都能较为轻松地听清，完全理解意思（聆听努力度得分高）

在这样的情况下，聆听努力度的好坏与通讯质量的关联性更高，能够代表用户在噪声场景下实际的体验。

Part.02

聆听努力度的标准化

与POLQA、TMOS这些参数相比，聆听努力度（Listening Effort）听上去像是个新鲜玩意儿，但其实它并不是突然出现的。事实上，专家学者已经对其进行了多年研究并最终将其标准化，使之能够成为标准测试方法。该标准就是欧洲电信标准化协会ETSI推出的TS 103 558标准，标准中主要包含了两部分内容：

聆听努力度主观听音试验方法设计
聆听努力度客观测试工具实现方法

聆听努力度作为一个基于主观出发的评价方法，需要能够准确地反映出人的听觉感受。因此需要从主观试验出发获取能正确反映用户体验的数据。标准基于ITU P.800与P.835中的指导方法进行了主观试验设计，并以此为基础进行了主观听音试验并收集数据。

此外作为一个评价工具，使用方便是非常重要的一点。POLQA、3QUEST这些成功的“前辈”在操作时，就只需要使用设备进行信号采集便可以直接通过算法计算得到结果。因此将评价方法客观工具化也是必然的演化方向，标准中显然也囊括了这一部分。图1是标准中给出的聆听努力度客观计算方法框架，框架中引入了双耳模型（蓝色部分）与双耳信号（橙色部分）处理模块，以便更好地反映人的实际双耳听觉特性。只需将d(k)与r(k)信号输入到算法中，经过处理计算便可得到最终的MOSLE结果。其中d(k)是经过被测试系统输出的信号，r(k)是包含原始纯净语音的全音频带宽参考信号。

图 1 聆听努力度客观评价工具化计算模型框架

整个计算方法模型会训练收集到的大量主观试验数据，并验证训练后的最终模型，以使其输出的结果很好地匹配主观试验结果，作为客观测试工具来实现聆听努力度的评价。

那么，在具体的应用场景中应该如何评价聆听努力度呢？需要什么工具？又该如何配置呢？我们将在下一期揭晓。

来源：海德声科 HEAD acoustics