Разработчики из Facebook AI в будущем готовы представить новый алгоритм обучения с подкреплением под названием DD-PPO.
Данная новинка позволит системам ИИ перемещаться в незнакомой обстановке с применением исключительно координат, полученных с компаса, RGB-D камеры и GPS.
Иными словами, с того момента, когда новинка будет внедрена, все интеллектуальные машины, тесно взаимодействующие с физическим миром, смогут эффективно перемещаться в совершенно незнакомой среде без использования какой-либо карты.
Данная технология уже давно является целью ИИ-сообщества.
Необходимость этой разработки состоит в том, что современные карты реального мира достаточно быстро устаревают.
В некоторых случаях достаточно и нескольких месяцев, чтобы искомый объект смог сменить местонахождение.
По этой причине инженеры намерены создать ИИ для физического мира, который будет способен перемещаться без помощи карты.
В настоящее время исследователи из Facebook AI разработали новый алгоритм обучения, который эффективно решает вопросы точечной навигации с использованием таких инструментов, как компас, камеры RGB-D и GPS.
Существующие системы, основанные на машинном обучении, превосходят человека, обладающего экспертными знаниями как в науке, так и в различных сложных играх.
Их недостаток в том, что они опираются на огромный пласт обучающих инструментов.
DD-PPO синхронно работает на нескольких машинах и не имеет сервера параметров.
При этом DD-PPO демонстрирует почти линейное масштабирование и практически идеальную точечную навигацию.
В такой системе исходная точка устанавливается в произвольном положении в незнакомой среде и получает задание перейти к целевым координатам без использования карты.
Само устройство может использовать только компас, GPS и либо RGB или RGB-D камеры.
Инженеры использовали функцию масштабирования DD-PPO для обучения агента за 2,5 миллиарда шагов.
Такой показатель равен 80-летнему опыту человека.
Все этапы обучения были завершены менее чем за три дня с 64 графическими процессорами.
Как оказалось, 90% пиковой производительности пришлись на первые 100 миллионов шагов с меньшим количеством вычислительных ресурсов.
Уже на этапе миллиарда шагов агент достиг опыта и успеха 99,9 %, в то время как предыдущие системы достигали 92 % успеха.
Такие системы в будущем смогут отражать соответствующую информацию пользователям, носящим очки дополненной реальности.
Кроме того, разработанные модели могут работать даже внутри офисных зданий, где карты и данные GPS недоступны.
Фото: Pixabay