Яндекс научит машины понимать речь человека

05.08.2014 09:17
Обновлено: 20.09.2017 20:49

 

Яндекс запустил облачный сервис распознавания речи SpeechKit Cloud. С его помощью разработчики, в том числе из Беларуси, смогут научить свои продукты понимать человеческий голос. Об этом Белновостям сообщили в пресс-службе компании Яндекс.

Облачный сервис распознавания речи уже использует Cubic Robotics — разработчик домашнего робота CUBIC. Дроид понимает заданные голосом вопросы и отвечает на них. А вот компания Oktell, выпускающая программное обеспечение для колл-центров, использует технологию Яндекса, чтобы распознавать речь звонящего в колл-центр человека и соединять его с нужным специалистом.

В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую Яндекс запустил в 2013 году. Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов. Поддержку SpeechKit Cloud можно добавить в самые разные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы.

Качество распознавания речи зависит от тематики запроса. Если вы диктуете смс или заметку, оно составляет 82%, если произносите короткий запрос – 85%. А «географические» запросы (например, адреса и названия организаций) Yandex SpeechKit понимает с точностью, близкой к способностям человека, — 95%.

Белновости
Фото: © Белновости

«В мире есть всего несколько разработчиков систем распознавания голоса – некоторые из них используются, например, в приложениях для смартфонов и планшетов. Однако систем, понимающих русскую речь, значительно меньше: адаптация подобной технологии под конкретный язык занимает очень много времени, так что иностранные разработчики до нашего языка часто «не доходят», –  отметил руководитель отдела разработки голосовых сервисов и продуктов Яндекса Денис Филиппов.

SpeechKit Cloud понимает русский и турецкий языки, однако в планах Яндекса «обучить» технологию и другим языкам. Обработка голосовых запросов производится на серверах Яндекса, рассчитанных на высокие нагрузки. Распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа. Разработчикам предоставили возможность бесплатно использовать SpeechKit Cloud в течение месяца.

Автор: Белновости Редакция интернет-портала