感知客观聆听质量分析

现代语音通信已不再是传统接线生时代的交换式系统，而是更依赖网络基础建设的封包传递，取而代之的是各种通讯软件。现代化语音服务的提供，更涉及了众多不同的厂商，例如:因特网服务供货商、手机制造商、通讯软件供货商…等。因此在通信系统的快速发展过程中，如何在众多服务堆栈的架构确保语音质量就变得很重要。在这当中，评估语音质量的方法就成为首要关键。
语音质量方法的应用对象，我们可以看到OPTICOM公司在ITU Workshop 的数据(如下)

可将它分成两类: 终端设备的声学性能、网络传输对语音的损伤。

终端设备的声学性能:其中具体的终端设备例如像是耳机麦克风、视频会议系统，笔电自带的喇叭麦克风…等。这些设备也还有会连带影响声学性能的信号处理算法、编译码器、降噪算法…等。
网络传输对语音的损伤: 像是有线传输/无线传输、驱动程序、流量控制…等。
因此, 语音质量测试的应用对象, 在终端装置方面, 不管是耳麦/手机/笔电/视频会议系统…等都是适合的待测物. 在软硬件方面, 通讯软件/DSP算法/编译码器…等也都是可以成为待测物的对象。

评估方法可概分为两类：
▶ 主观评估法
▶ 客观评估法
传统的主观评估，需召集一组人，并要求他们判断各种音频片段的音质，通常判断评分值介于1到5。将所有个人分数加总后再除以个体数。其结果称之为平均值意见得分（MOS）。

虽然用真实的人类受试者进行测试成本高又耗时，但可以使用包含基于心理声学建模(如 PESQ 或 POLQA)的算法来克服这些限制。如果正确使用，这些模型将非常匹配来自人类群体的结果。这种自动化允许开发中的快速迭代以及高效的生产线验证。获得的测量结果被归类为客观的，因为它们不受人的气质或测试条件的影响，且结果是完全可重复的。
主观评估法需要大量的测试人员及工时，耗费成本甚巨。相对来说，客观评估采用仪器设备就不会有这样的问题。

PESQ是上一代应用于通信系统和语音编码的端对端语音质量评估的客观语音质量评估方法。它被定义在ITU-R Rec. P.862 标准中。但由于它的局限性，国际电信联盟ITU 发展了新的ITU-T Rec. P.863 标准，称之为POLQA（Perceptual Objective Listening Quality Analysis）也就是『感知客观聆听质量分析』。

其中，所谓的“感知”指的是使用算法来预测真人聆听的主观得分。

PESQ和POLQA起源于 ITU-T 的客观语音质量测量系列，该系列始于 1997 年的 P.861 (PSQM)，2001 年被 P.862 (PESQ) 取代。它最初是为测试窄带网络而开发的。之后在 2010 年被ITU-T P.863 POLQA有效取代，并支持 WebRTC 和 IP 的呼叫，。

MOS 通常用于从 1（质量差）到 5（质量极好）的范围内描述语音质量。

百佳泰的POLQA服务, 采用Audio Precision 方案, 提供以下特性：
● ITU-T P.863 语音质量感知评估，映射到 MOS 尺度
● 窄带、宽带和超宽带操作
● 与声学接口一起使用
● 输入

以 8、16 或 48 kHz 采样的 16 位线性音频输入长度为 6 到 12 秒的语音文件

● 测量

单一MOS值
瞬时 MOS值: 随时间变化的MOS曲线图
平均 MOS（包含语音活动期和静音期）
值批处理: 逐一评估每个样本音文件的MOS值

这些量测能力对于无线耳机、智能型耳机、智能型手机… 等产品的语音通讯质量, 将带来莫大帮助。

【了解更多相关对于无线耳机、智能型耳机、智能型手机… 等产品的语音通讯质量测试问题，欢迎联系百佳泰】

联系专属技术顾问 →cn_service@allion.com.cn

Post Views: 1,427

System 文章, 技術文庫