Причиной, по которой исследователи-робототехники стараются как можно больше обучать и испытывать свои творения в виртуальной реальности, является опасение. Ведь любое столкновение или падение робота может привести к выходу из строя дорогостоящего оборудования, а в особо тяжелых случаях — нанести вред здоровью присутствующих при этом людей. Однако, разрыв между виртуальной и обычной реальностью весьма и весьма велик, и в очень редких случаях навыки, приобретенные роботами в виртуальной реальности, можно использовать на практике без каких-либо дополнительных действий. Свое решение этой проблемы продемонстрировали специалисты из университета Карнеги-Мелоун. В разработанной ими методике обучения системы управления беспилотником, присутствует лишь одна цель — врезаться во что-нибудь и сделать из произошедшего надлежащие выводы.
В качестве проверки работоспособности такой оригинальной методики обучения системы, построенной на принципах искусственного интеллекта, был использован беспилотник AR Drone 2.0. Этот беспилотник был запущен в помещение с 20 комнатами, как пустыми, так и заполненными различными предметами. За 40 часов, которые беспилотник налетал внутри этого помещения, он «умудрился» совершить 11 500 столкновений, некоторые из которых заканчивались достаточно трагично. Но относительная простота конструкции, дешевизна деталей корпуса беспилотника и других его узлов позволила производить быструю замену и продолжить процесс самообучения.
Каждое из столкновений носило свой уникальный характер и происходило в случайном месте. Если беспилотнику удавалось остаться в воздухе после столкновения, он возвращался на исходную позицию и сразу же отправлялся к случайной точке снова «искать приключений».
Во время самообучения камеры беспилотника фиксировали все со скоростью 30 кадров в секунду. Каждый из зафиксированных моментов столкновения разделялся на две части, первая — это когда беспилотник еще оставался в полном порядке, а вторая — это собственно момент столкновения и последующих за ним событий. Эти два набора данных пропускались через многослойную нейронную сеть, которая на практике обучалась процессу управления полетом. После огромного числа столкновений разной тяжести нейронная сеть накопила необходимый ей объем информации и научилась управлять беспилотником должным образом. После этого летательный аппарат мог летать, ничего не задевая и не сталкиваясь ни с чем даже в очень маленьких и загроможденных помещениях.
Естественно, работа системы искусственного интеллекта сильно уступает возможностям человека-пилота, кроме этого система иногда еще «теряется» в незнакомой сложной обстановке, к примеру, в комнате, в которой стоит множество стульев с несплошными спинками. А большие окна, стеклянные стены и двери система попросту иногда не замечает, так как определение наличия прозрачных препятствий является одной из самых сложных задач в робототехнике.
Самым очевидным преимуществом такого подхода к обучению систем управления роботами является его полная автономность, участи человека в этом деле ограничивается лишь заменой разряженных аккумуляторных батарей и заменой вышедших из строя деталей. Все остальное, что касается сбора и анализа данных, система искусственного интеллекта делает полностью самостоятельно. Обучение же при помощи человека инструктора дает намного лучшие результаты, но оно требует участия человека и использования дорогостоящего оборудования, к примеру, систем захвата и оцифровки движений на основе высококачественных и быстродействующих камер.
Источник: