只需3kbps就能清晰通話,這個谷歌音訊工具開源了
子豪 發自 凹非寺 量子位 報道 | 公眾號 QbitAI
3kbps也能清晰通話的神器
Lyra
,開源了!
Lyra是 谷歌公司 推出的一款
不懼低頻寬
的音訊編解碼器,用來實現隨時隨地高質量通話。
3kbps是什麼概念?
換算成生活中常見的單位,等於
0.375KB/s
。
對比來看更加直觀, Skype 官網給出的通話最低速度是30kbps,頻寬要求整整高出了
10倍
。
Lyra利用
機器學習 模型
,將原始音訊壓縮到3kbps,即使沒有高速網路,也能得到自然清晰的語音。
它的架構與傳統的編解碼器類似,分為編碼器和解碼器兩部分:
編碼器
以40毫秒為單位,從語音中提取特徵,進行壓縮後透過網路傳輸。
解碼器
利用機器學習模型,能使用最少的資料量重建語音,將特徵轉換成完整的音訊波形,以進行播放。
頻寬要求低、效果更好
在Lyra之前,音訊編解碼器的 位元率 越低,語音的清晰度就越差,並且機械感越重。
傳統的音訊編解碼器使用的是數字訊號處理技術,而Lyra則依賴其強大的
訊號重建能力
。
由於Lyra無需逐個處理訊號,因此無需高頻寬,而且在保持低位元率的同時,還能提供高質量的音訊輸出。
谷歌還使用Lyra與 Opus 、Speex,在6kbps和3kbps的情況下,對同一音訊的壓縮質量進行
對比測試
。
結果顯示:
在
3kbps
的情況下,Lyra效能
優於現有的
其他編解碼器;
在
8kbps
的情況下,其效能
優於Opus
,同時降低了超過60%的頻寬;
甚至,Lyra在
3kbps
情況下的語音清晰度,也
優於6kbps
情況下的Opus。
谷歌公司認為Lyra可能有廣泛的應用前景,比如:降低音訊檔案大小,以儲存大量語音;節省手機電量;以及緩解網路擁堵等。
已在 GitHub 開源
現在,Lyra已經在GitHub上開源。
Lyra使用
Bazel
構建框架,並且使用
C++
編寫程式碼,以保證速度、效率和可操作性。
這一版本支援使用者在
Linux
上開發和除錯,還針對64位
ARM Android
平臺進行了效能最佳化,使它不僅能在 雲伺服器 上執行,而且還可以在手機上實時執行和訓練。
此外,Lyra還為開發人員提供了編碼和解碼所需的工具。
谷歌工程師Andrew Storus和Michael Chinen表示:
“很高興看到 開源社群 的創造力能體現在Lyra上,以開發更多獨特和有影響力的應用。”
感興趣的讀者可戳下方連結瞭解詳情。
參考連結: [1]https://github。com/google/lyra [2]https://venturebeat。com/2021/04/06/google-launches-lyra-codec-in-beta-to-reduce-voice-call-bandwidth-usage/ [3]https://ai。googleblog。com/2021/02/lyra-new-very-low-bitrate-codec-for。html [4]https://opensource。googleblog。com/2021/04/lyra-enabling-voice-calls-for-next-billion-users。html
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態