Специалисты из британской компании DeepMind, специализирующейся на технологиях искусственного интеллекта, представили нейросеть, способную читать по губам.
Для обучения ИИ чтению по губам разработчики прокрутили более 140 тысяч часов видео субтитрами. Параллельно была создана программа, создающая небольшие по продолжительности ролики, где уже расшифровывается произношение каждой фонемы.
Апробация новой нейросети показала, что искусственный интелелект ошибался при чтении по губам в 41 % слов. Для сравнения, предыдущая версия делала ошибки в 77 % случаев. Специалисты остались довольны результатом и намерены в дальнейшем минимизировать ошибки.
Данная разработка будет полезна для немых людей. В будущем разработчики планируют представить специальную мобильную версию.
Фото: из открытых источников