Повышение качества звонков в Google Duo для пользователей с медленным интернетом благодаря ИИ

Carder

Professional
Messages
2,619
Reputation
9
Reaction score
1,719
Points
113
Новый аудиокодек может в конечном итоге помочь во всех звонках VOIP

Google Duo


Есть небольшая вероятность, что кому-то удалось избежать услуг видео или голосовых вызовов, которые полагаются на интернет-соединения на этом этапе, в немалой степени благодаря глобальной пандемии.

Есть еще меньшая вероятность того, что эти вызовы были полностью свободны от прерываний, сбоев, задержек и других деструктивных артефактов, но последнее достижение подразделения Google AI должно помочь в этом.

Как опубликовано в блоге Google AI, команда разработала новый аудиокодек Lyra, специально нацеленный на сжатие речи до более низкого битрейта.
В просто 3kbps (это кило бит в секунду), Лайра использует значительно более низкие данные, чем наиболее широко используемый кодек в настоящее время - с открытым исходным кодом Opus, который «получает прозрачное качество речи, неотличимый от оригинала» на 32kbps, но может работать на более низкие ставки.

Фактически, в исследованиях Google было обнаружено, что кодек Opus, работающий со скоростью 8 кбит / с, был менее предпочтителен, чем Lyra со скоростью 3 кбит / с, что означает сокращение пропускной способности на 60%.

Google Duo​

В своем сообщении в блоге Google AI объявил, что «в настоящее время развертывает Lyra [в Google Duo] для улучшения качества и надежности аудиовызовов в соединениях с очень низкой пропускной способностью».

Итак, если вы являетесь пользователем Google Duo на Android или iOS и страдаете от плохого или нестабильного интернет-соединения, вы вскоре можете увидеть значительное улучшение качества и стабильности звонков.
Нет конкретного упоминания о том, когда кодек станет широко доступным, но вполне вероятно, что это будет закулисное обновление, поэтому оно может не появиться с особой помпой, когда появится.

ИИ и будущее​

Достижения Lyra обусловлены сочетанием существующей технологии кодеков Google AI и «достижений в области машинного обучения с моделями, обученными на тысячах часов данных». Эти данные включают говорящих на более чем 70 языках, свободно доступных в библиотеках с открытым исходным кодом, чтобы гарантировать универсальное применение.

Сам блог гораздо глубже погружается в детали того, как машинное обучение позволило использовать новую технологию, а также использует фрагменты аудио, чтобы продемонстрировать разницу между исходным аудио, Lyra и другими кодеками при различных битрейтах.

Команда планирует продолжить оптимизацию Lyra, улучшая ее качество и надежность в надежде, что она будет адаптирована за пределами приложения Google Duo. Это, вероятно, будет означать, что другие приложения и службы VOIP и видеоконференцсвязи получат выгоду от использования кодека в будущем.

Более того, в сообщении также говорится, что команда «также начинает исследовать, как эти технологии могут привести к низкоскоростному универсальному аудиокодеку», что может означать, что неречевые варианты использования, такие как музыка и другое аудио, могут быть видны такие же улучшения.
 
Top