Part.01
为什么会听得费劲?
说到通讯质量,大家可能第一时间会想到语音质量,进而联想到POLQA、TMOS这些语音质量分析方法。但其实语音质量本身不能完全代表通讯质量或实际的通讯体验,它只是通讯质量的一个方面。在安静场景下,语音质量本身与通讯质量的直接关联性很高。但是在某些场景下则不然,比如:
-
在运行的地铁上
-
在行驶在高速上的汽车里
-
在演唱会现场
-
在KTV包厢里
这些都是生活中常见的一些强噪声场景。当你身处其中,在使用手机、耳机进行通讯时,即便使出洪荒之力也难以听清对方语音。这是因为虽然本身传递过来的语音信号质量可能很高,但由于语音被周围噪声所掩盖,通讯质量也就变得不尽人意了。所谓“通讯(communication)”,即双方能够听清楚对方发送过来的语音,并在此基础上得以继续进行沟通。在这种情况下,只有能相对轻松地听明白对方的语音,才算是令人满意的通讯质量。因此,仅评价语音质量是远远不够的,我们需要更有针对性的评价方法。
为此,人们引入了聆听努力度(Listening Effort)这个概念,并给出了详细分级与对应的描述:
数值 |
描述 |
5(最佳) |
可以完全放松;不用尽力听 |
4 |
需要集中注意力;但不用太尽力听 |
3 |
需要适当地尽力去听 |
2 |
需要非常尽力地去听 |
1(最差) |
再怎么努力都无法听懂句子的含义 |
表格 1 聆听努力度的分级
从上图不难看出,聆听努力度是从人的感受出发,以听明白为条件,是在达成这个条件的前提下人所需要付出的“代价”,也就是这里的努力度。通俗来说就是听明白传递来的语音信号吃不吃力,同样最终是听明白了,但下面两种体验对于用户来说可谓大相径庭:
-
并非所有内容都听清楚了,还个别字眼还得靠猜,但能够理解大部分意思,通讯可以继续(聆听努力度得分不佳)
-
所有内容都能较为轻松地听清,完全理解意思(聆听努力度得分高)
在这样的情况下,聆听努力度的好坏与通讯质量的关联性更高,能够代表用户在噪声场景下实际的体验。
Part.02
聆听努力度的标准化
与POLQA、TMOS这些参数相比,聆听努力度(Listening Effort)听上去像是个新鲜玩意儿,但其实它并不是突然出现的。事实上,专家学者已经对其进行了多年研究并最终将其标准化,使之能够成为标准测试方法。该标准就是欧洲电信标准化协会ETSI推出的TS 103 558标准,标准中主要包含了两部分内容:
-
聆听努力度主观听音试验方法设计
-
聆听努力度客观测试工具实现方法
聆听努力度作为一个基于主观出发的评价方法,需要能够准确地反映出人的听觉感受。因此需要从主观试验出发获取能正确反映用户体验的数据。标准基于ITU P.800与P.835中的指导方法进行了主观试验设计,并以此为基础进行了主观听音试验并收集数据。
此外作为一个评价工具,使用方便是非常重要的一点。POLQA、3QUEST这些成功的“前辈”在操作时,就只需要使用设备进行信号采集便可以直接通过算法计算得到结果。因此将评价方法客观工具化也是必然的演化方向,标准中显然也囊括了这一部分。图1是标准中给出的聆听努力度客观计算方法框架,框架中引入了双耳模型(蓝色部分)与双耳信号(橙色部分)处理模块,以便更好地反映人的实际双耳听觉特性。只需将d(k)与r(k)信号输入到算法中,经过处理计算便可得到最终的MOSLE结果。其中d(k)是经过被测试系统输出的信号,r(k)是包含原始纯净语音的全音频带宽参考信号。
图 1 聆听努力度客观评价工具化计算模型框架
整个计算方法模型会训练收集到的大量主观试验数据,并验证训练后的最终模型,以使其输出的结果很好地匹配主观试验结果,作为客观测试工具来实现聆听努力度的评价。
那么,在具体的应用场景中应该如何评价聆听努力度呢?需要什么工具?又该如何配置呢?我们将在下一期揭晓。
来源:海德声科 HEAD acoustics