Новый аудиокодек может в конечном итоге помочь во всех звонках VOIP
Есть небольшая вероятность, что кому-то удалось избежать услуг видео или голосовых вызовов, которые полагаются на интернет-соединения на этом этапе, в немалой степени благодаря глобальной пандемии.
Есть еще меньшая вероятность того, что эти вызовы были полностью свободны от прерываний, сбоев, задержек и других деструктивных артефактов, но последнее достижение подразделения Google AI должно помочь в этом.
Как опубликовано в блоге Google AI, команда разработала новый аудиокодек Lyra, специально нацеленный на сжатие речи до более низкого битрейта.
В просто 3kbps (это кило бит в секунду), Лайра использует значительно более низкие данные, чем наиболее широко используемый кодек в настоящее время - с открытым исходным кодом Opus, который «получает прозрачное качество речи, неотличимый от оригинала» на 32kbps, но может работать на более низкие ставки.
Фактически, в исследованиях Google было обнаружено, что кодек Opus, работающий со скоростью 8 кбит / с, был менее предпочтителен, чем Lyra со скоростью 3 кбит / с, что означает сокращение пропускной способности на 60%.
Итак, если вы являетесь пользователем Google Duo на Android или iOS и страдаете от плохого или нестабильного интернет-соединения, вы вскоре можете увидеть значительное улучшение качества и стабильности звонков.
Нет конкретного упоминания о том, когда кодек станет широко доступным, но вполне вероятно, что это будет закулисное обновление, поэтому оно может не появиться с особой помпой, когда появится.
Сам блог гораздо глубже погружается в детали того, как машинное обучение позволило использовать новую технологию, а также использует фрагменты аудио, чтобы продемонстрировать разницу между исходным аудио, Lyra и другими кодеками при различных битрейтах.
Команда планирует продолжить оптимизацию Lyra, улучшая ее качество и надежность в надежде, что она будет адаптирована за пределами приложения Google Duo. Это, вероятно, будет означать, что другие приложения и службы VOIP и видеоконференцсвязи получат выгоду от использования кодека в будущем.
Более того, в сообщении также говорится, что команда «также начинает исследовать, как эти технологии могут привести к низкоскоростному универсальному аудиокодеку», что может означать, что неречевые варианты использования, такие как музыка и другое аудио, могут быть видны такие же улучшения.
![Google Duo Google Duo](https://cdn.mos.cms.futurecdn.net/2mmHoPixG9CFRj3qFRUKpn-320-80.jpg)
Есть небольшая вероятность, что кому-то удалось избежать услуг видео или голосовых вызовов, которые полагаются на интернет-соединения на этом этапе, в немалой степени благодаря глобальной пандемии.
Есть еще меньшая вероятность того, что эти вызовы были полностью свободны от прерываний, сбоев, задержек и других деструктивных артефактов, но последнее достижение подразделения Google AI должно помочь в этом.
Как опубликовано в блоге Google AI, команда разработала новый аудиокодек Lyra, специально нацеленный на сжатие речи до более низкого битрейта.
В просто 3kbps (это кило бит в секунду), Лайра использует значительно более низкие данные, чем наиболее широко используемый кодек в настоящее время - с открытым исходным кодом Opus, который «получает прозрачное качество речи, неотличимый от оригинала» на 32kbps, но может работать на более низкие ставки.
Фактически, в исследованиях Google было обнаружено, что кодек Opus, работающий со скоростью 8 кбит / с, был менее предпочтителен, чем Lyra со скоростью 3 кбит / с, что означает сокращение пропускной способности на 60%.
Google Duo
В своем сообщении в блоге Google AI объявил, что «в настоящее время развертывает Lyra [в Google Duo] для улучшения качества и надежности аудиовызовов в соединениях с очень низкой пропускной способностью».Итак, если вы являетесь пользователем Google Duo на Android или iOS и страдаете от плохого или нестабильного интернет-соединения, вы вскоре можете увидеть значительное улучшение качества и стабильности звонков.
Нет конкретного упоминания о том, когда кодек станет широко доступным, но вполне вероятно, что это будет закулисное обновление, поэтому оно может не появиться с особой помпой, когда появится.
ИИ и будущее
Достижения Lyra обусловлены сочетанием существующей технологии кодеков Google AI и «достижений в области машинного обучения с моделями, обученными на тысячах часов данных». Эти данные включают говорящих на более чем 70 языках, свободно доступных в библиотеках с открытым исходным кодом, чтобы гарантировать универсальное применение.Сам блог гораздо глубже погружается в детали того, как машинное обучение позволило использовать новую технологию, а также использует фрагменты аудио, чтобы продемонстрировать разницу между исходным аудио, Lyra и другими кодеками при различных битрейтах.
Команда планирует продолжить оптимизацию Lyra, улучшая ее качество и надежность в надежде, что она будет адаптирована за пределами приложения Google Duo. Это, вероятно, будет означать, что другие приложения и службы VOIP и видеоконференцсвязи получат выгоду от использования кодека в будущем.
Более того, в сообщении также говорится, что команда «также начинает исследовать, как эти технологии могут привести к низкоскоростному универсальному аудиокодеку», что может означать, что неречевые варианты использования, такие как музыка и другое аудио, могут быть видны такие же улучшения.