Разработка от Facebook позволит ИИ перемещаться в незнакомой среде без карты

27.01.2020 15:23

Разработчики из Facebook AI в будущем готовы представить новый алгоритм обучения с подкреплением под названием DD-PPO.

Данная новинка позволит системам ИИ перемещаться в незнакомой обстановке с применением исключительно координат, полученных с компаса, RGB-D камеры и GPS.

Иными словами, с того момента, когда новинка будет внедрена, все интеллектуальные машины, тесно взаимодействующие с физическим миром, смогут эффективно перемещаться в совершенно незнакомой среде без использования какой-либо карты.

Данная технология уже давно является целью ИИ-сообщества.

Необходимость этой разработки состоит в том, что современные карты реального мира достаточно быстро устаревают.

Навигация

В некоторых случаях достаточно и нескольких месяцев, чтобы искомый объект смог сменить местонахождение.

По этой причине инженеры намерены создать ИИ для физического мира, который будет способен перемещаться без помощи карты.

В настоящее время исследователи из Facebook AI разработали новый алгоритм обучения, который эффективно решает вопросы точечной навигации с использованием таких инструментов, как компас, камеры RGB-D и GPS.

Существующие системы, основанные на машинном обучении, превосходят человека, обладающего экспертными знаниями как в науке, так и в различных сложных играх.

Их недостаток в том, что они опираются на огромный пласт обучающих инструментов.

DD-PPO синхронно работает на нескольких машинах и не имеет сервера параметров.

При этом DD-PPO демонстрирует почти линейное масштабирование и практически идеальную точечную навигацию.

В такой системе исходная точка устанавливается в произвольном положении в незнакомой среде и получает задание перейти к целевым координатам без использования карты.

Само устройство может использовать только компас, GPS и либо RGB или RGB-D камеры.

Инженеры использовали функцию масштабирования DD-PPO для обучения агента за 2,5 миллиарда шагов.

Такой показатель равен 80-летнему опыту человека.

Все этапы обучения были завершены менее чем за три дня с 64 графическими процессорами.

Как оказалось, 90% пиковой производительности пришлись на первые 100 миллионов шагов с меньшим количеством вычислительных ресурсов.

Уже на этапе миллиарда шагов агент достиг опыта и успеха 99,9 %, в то время как предыдущие системы достигали 92 % успеха.

Такие системы в будущем смогут отражать соответствующую информацию пользователям, носящим очки дополненной реальности.

Кроме того, разработанные модели могут работать даже внутри офисных зданий, где карты и данные GPS недоступны.

Фото: Pixabay

Игорь Зур Автор: Игорь Зур Редактор интернет-ресурса