Британские ученые из Оксфордского университета разработали инновационную программу, позволяющую распознавать движение губ. Оказалось, что новый искусственный интеллект в 2 раза точнее в переводе предложений, чем сам человек.
Программу, предназначенную для чтения по губам, под названием LipNet можно установить на смартфон. Ожидается, что оно должно помочь людям с ослабленным слухом.
Сложность разработки заключалась в том, что речь человека является очень сложной и многогранной, где одно движение губ может отвечать различным фонемам или основным единицам звука. В связи с этим, исследователи предупреждают, что иногда могут быть ошибки, которые в некоторых случаях могут приводить к юмористическим результатам.
Работа приложения основана на глубоком обучении, используя 29 тысяч трехсекундных видео, маркированных заголовками. Результаты апробации свидетельствуют, что искусственный интеллект способен воспроизводить целые предложения с точностью в 93,4%, в то время как человек достигает лишь 52,3%.