首頁科技 > 正文

只需3kbps就能清晰通話,這個谷歌音訊工具開源了

2021-04-12由 量子位 發表于 科技

子豪 發自 凹非寺 量子位 報道 | 公眾號 QbitAI

3kbps也能清晰通話的神器

 Lyra

,開源了!

Lyra是 谷歌公司 推出的一款

 不懼低頻寬

的音訊編解碼器,用來實現隨時隨地高質量通話。

3kbps是什麼概念?

換算成生活中常見的單位,等於

 0.375KB/s

對比來看更加直觀, Skype 官網給出的通話最低速度是30kbps,頻寬要求整整高出了

 10倍

只需3kbps就能清晰通話,這個谷歌音訊工具開源了

Lyra利用

 機器學習 模型

,將原始音訊壓縮到3kbps,即使沒有高速網路,也能得到自然清晰的語音。

它的架構與傳統的編解碼器類似,分為編碼器和解碼器兩部分:

只需3kbps就能清晰通話,這個谷歌音訊工具開源了

編碼器

以40毫秒為單位,從語音中提取特徵,進行壓縮後透過網路傳輸。

解碼器

利用機器學習模型,能使用最少的資料量重建語音,將特徵轉換成完整的音訊波形,以進行播放。

頻寬要求低、效果更好

在Lyra之前,音訊編解碼器的 位元率 越低,語音的清晰度就越差,並且機械感越重。

傳統的音訊編解碼器使用的是數字訊號處理技術,而Lyra則依賴其強大的

 訊號重建能力

由於Lyra無需逐個處理訊號,因此無需高頻寬,而且在保持低位元率的同時,還能提供高質量的音訊輸出。

只需3kbps就能清晰通話,這個谷歌音訊工具開源了

谷歌還使用Lyra與 Opus 、Speex,在6kbps和3kbps的情況下,對同一音訊的壓縮質量進行

 對比測試

結果顯示:

 3kbps

的情況下,Lyra效能

 優於現有的

其他編解碼器;

 8kbps

的情況下,其效能

 優於Opus

,同時降低了超過60%的頻寬;

甚至,Lyra在

 3kbps

情況下的語音清晰度,也

 優於6kbps

情況下的Opus。

只需3kbps就能清晰通話,這個谷歌音訊工具開源了

谷歌公司認為Lyra可能有廣泛的應用前景,比如:降低音訊檔案大小,以儲存大量語音;節省手機電量;以及緩解網路擁堵等。

已在 GitHub 開源

現在,Lyra已經在GitHub上開源。

只需3kbps就能清晰通話,這個谷歌音訊工具開源了

Lyra使用

 Bazel

構建框架,並且使用

 C++

編寫程式碼,以保證速度、效率和可操作性。

這一版本支援使用者在

 Linux

上開發和除錯,還針對64位

 ARM Android

平臺進行了效能最佳化,使它不僅能在 雲伺服器 上執行,而且還可以在手機上實時執行和訓練。

此外,Lyra還為開發人員提供了編碼和解碼所需的工具。

谷歌工程師Andrew Storus和Michael Chinen表示:

“很高興看到 開源社群 的創造力能體現在Lyra上,以開發更多獨特和有影響力的應用。”

感興趣的讀者可戳下方連結瞭解詳情。

參考連結: [1]https://github。com/google/lyra [2]https://venturebeat。com/2021/04/06/google-launches-lyra-codec-in-beta-to-reduce-voice-call-bandwidth-usage/ [3]https://ai。googleblog。com/2021/02/lyra-new-very-low-bitrate-codec-for。html [4]https://opensource。googleblog。com/2021/04/lyra-enabling-voice-calls-for-next-billion-users。html

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

頂部