Американские ученые разработали программу Speech2Face, которая умеет воссоздавать внешность человека по его голосу.
Данная нейросеть училась на основе просмотров видеороликов с записями голосов и людей. Во время обучения было просмотрено несколько миллионов записей.
Теперь программа может воссоздать изображение человека, услышав его голос. Основных критерия 3 – пол, возраст, раса.
Пока в системе есть погрешности. Например, пол и расу алгоритм определяет хорошо, а в шкале возраста случаются разбежки до 10 лет.
Как заявляли разработчики, их целью не было точное воссоздание фотографии человека, а лишь попытка определения схожих черт, так как на основании лишь аудиоряда трудно сказать, какая форма лба у человека или определить, есть ли у него горбинка на носу.
Фото: Pixabay