ГлавнаяSoftwareПрограммное обеспечениеКомпьютерная речь станет более человечной благодаря Google DeepMind

Компьютерная речь станет более человечной благодаря Google DeepMind

Google DeepMind

Компания Google уже давно занимается изучением искусственного интеллекта в различных его проявлениях. Но ей, как и остальным игрокам рынка, не удалось сделать так, чтобы компьютерная речь была более живой и человечной. Если воспользоваться голосовым поиском или озвучиванием слов в переводчике от Google, то слышно, что голос очень роботизированный. Для решения этой проблемы Google DeepMind разработала новый искусственный интеллект WaveNet, способный имитировать человеческую речь. Произношение всё ещё не идеальное, но оно на 50% лучше того, что существует на сегодняшний день. Данный искусственный интеллект может даже создавать собственную музыку на основе изученных классических произведений на фортепиано, сообщает 4pda.ru.

Для достижения более человечной речи WaveNet использует обучение с помощью нейронных сетей и фрагменты реальных человеческих голосов. Кроме того, система подбирает правила лингвистики и фонетики для каждой отдельной фразы. Но что более важно — для синтеза такой речи WaveNet ежесекундно обрабатывает 16 тыс. образцов звука, что и позволяет сделать компьютерный голос более человечным.

К сожалению, ожидать использования WaveNet в сервисах Google в ближайшее время не стоит, так как на обработку такого аудио необходимо слишком много вычислительной мощности. Послушать примеры произношения WaveNet можно в официальном блоге DeepMind.

Tesla обновила функцию Autopilot
Google выпустила Cardboard Camera для iOS
Оформление подписки
Оформить подписку на журнал InfoCity вы можете заполнив приведенную
ниже форму. Стоимость одного выпуска — 1 манат.
Ваше имя
Адрес доставки журнала и номер телефона для контактов
Число месяцев подписки
Благодарим вас за подписку!