平均意見評分(MOS):語音質量的衡量標準

在語音和視頻通信中,質量通常決定了這種體驗是好還是壞。 除了我們聽到的定性描述之外,還有一種表達語音和視頻質量的數字方法,比如'相當好'或'非常差'。 它被稱為平均意見評分(MOS)。 MOS給出了在傳輸之後接收的媒體的感知質量的數字指示,並最終使用編解碼器進行壓縮。

MOS表示一個數字,從1到5,1是最差的,5是最好的。 MOS是相當主觀的,因為它是基於人們在測試過程中被人們察覺到的數字而形成的。 但是,有一些軟件應用程序可以在網絡上測量MOS,如下所示。

平均意見分數值

以整數計算,這些數字很容易評分。

這些值不需要是整數。 某些閾值和限值通常以該MOS頻譜的十進制值表示。 例如,4.0到4.5的值被稱為長話質量並且導致完全滿意。 這是PSTN的正常價值,許多VoIP服務都以此為目標,往往取得成功。 低於3.5的值被許多用戶認為是不可接受的。

MOS測試如何進行?

有一定數量的人坐下來聽音樂。 他們每個人都給出了從1到5之間的評分。然後計算算術平均值(平均值),給出平均意見評分。 在進行MOS測試時,ITU-T建議使用某些短語。 他們是:

影響平均意見評分的因素

MOS可以簡單地用於比較VoIP服務和提供商。 但更重要的是,它們被用於評估編解碼器的工作,它壓縮音頻和視頻以節省帶寬利用率,但質量下降一定程度。 然後在特定環境下為編解碼器進行MOS測試。

然而,如文章中提到的那樣 ,影響音頻和視頻傳輸質量的某些其他因素。 這些因素不應被計入MOS值,所以當確定MOS用於某個編解碼器,服務或網絡時,重要的是所有其他因素對於高質量都是有利的,因為假定MOS值在理想條件下獲得。

軟件自動平均意見評分測試

由於手動/人體MOS測試在很多方面都相當主觀且效率不高,因此現在有許多軟件工具可以在VoIP部署中執行自動MOS測試。 雖然他們缺乏人情味,但這些測試的好處在於他們考慮了所有可能影響語音質量的網絡依賴條件。 一些例子是AppareNet Voice,Brix VoIP測量套件,NetAlly,PsyVoIP和VQmon / EP。