什麼是語音識別?

用你的聲音作為輸入法

語音識別是一種允許對系統進行語音輸入的技術。 您可以與您的計算機,手機或設備通話,並使用您所說的輸入來觸發某些操作。 該技術正被用於替代其他輸入方法,如打字,點擊或以其他方式選擇。 這是一種使設備和軟件更加用戶友好並提高生產力的手段。

有很多應用和使用語音識別的領域,包括軍隊,幫助受傷的人(設想一個殘疾人或沒有手或手指的人),醫療領域,機器人等等。在不久的將來,由於其在電腦和手機等常見設備中的傳播,幾乎每個人都會接觸到語音識別。

某些智能手機正在有趣地使用語音識別。 iPhone和Android設備就是這方面的例子。 通過他們,您可以通過接聽諸如“致電辦公室”等口頭指示,向聯繫人發起呼叫。 其他命令也可能受理,如“打開藍牙”。

語音識別問題

語音識別在其被稱為語音到文本(STT)的版本中,也被長期用於將口語轉化為文本。 正如ViaVoice在盒子上所說的那樣,“你說話,它就是類型”。 但是我們知道STT存在一個問題。 十多年前,我嘗試過ViaVoice,並且在我的電腦上沒有持續一個星期。 為什麼? 這是非常不准確的,我最終花費了更多的時間和精力來講話和糾正,而不是打字。 ViaVoice是業界最好的之一,所以想像其餘的。 這項技術已經成熟和完善,但對文本的講話仍然讓人們提出問題。 其中一個主要困難是人們在發音方面的巨大差異。

並非所有的語言都可以用於語音識別,而那些通常不被支持的語言以及英語。 因此,大多數運行語音識別軟件的設備只能用英語進行合理的操作。

一些硬件要求使得語音識別在某些情況下難以部署。 你需要一個足夠智能的麥克風來過濾掉背景噪音,但同時又足夠強大以自然捕捉聲音。

說到背景噪音,它可能會導致整個系統失敗。 結果,由於不受用戶控制的噪音,語音識別在許多情況下失敗。

語音識別作為VoIP等新型手機和通信技術的輸入方法,而不是大規模文本輸入的生產力工具,已被證明是更好的選擇。

語音識別的應用

該技術在許多領域越來越受歡迎,並在以下方面取得成功:

- 設備控制。 只需向Android手機說“OK Google”即可啟動一個系統,這些系統都是您的語音命令。

- 車載藍牙系統。 許多汽車都配備了一個通過藍牙將其無線電機制連接到智能手機的系統。 然後,您可以在不觸摸智能手機的情況下撥打和接聽電話,甚至可以通過說出來撥打電話號碼。

- 語音轉錄。 在人們必須打字的地方,一些智能軟件會捕捉他們說出的單詞並將其轉錄成文字。 這是目前在某些文字處理軟件。 語音轉錄也適用於可視語音信箱