Алгоритм позволяет обучить робота действию за одну демонстрацию

19 мая 2017, 17:40 Виталий Войчук

Некоммерческая исследовательская организация OpenAI, финансируемая Элоном Маском, объявила о новом достижении в сфере развития роботов

Она создала алгоритм, который позволяет человеку обучать искусственный интеллект действиям, выполняя их в виртуальной реальности, сообщает "3Dnews".

Здесь используется метод одноразового имитационного обучения, который позволяет роботу повторять физическое действие, используя один-единственный пример.

OpenAI попыталась научить роботизированную руку складывать набор разноцветных кубиков. Человек в VR-шлеме проделывал необходимые действия в виртуальном окружении. После этого их изучала нейронная сеть, натренированная на основе сотен тысяч искусственно созданных изображений.

Поскольку сбор реальных изображений - дорого, трудно и долго, исследователи использовали искусственные картинки. OpenAI "скормила" алгоритму виртуальные образы стола и кубиков с различными фонами, эффектами освещения и текстурами. Так искусственный интеллект понимал сцену, не видев её раньше.

После этого алгоритм брал информацию из нейронной сети и отправлял её в другую, имитационную сеть. Она определяет намерения действия и повторяет его, предсказывая то, что сделал бы человек в данной ситуации. Сложность заключается в том, что расположение и цвет кубиков менялись каждый раз. Но программному обеспечению всё равно удавалось построить три столбика - каждый из двух кубов.

Роботу ни разу не показали видео или фото с реальными примерами действий.

"Наш робот научился выполнять задачу, несмотря на то, что движения должны отличаться от показанных в демонстрации, - объяснил Джош Тобин, член команды OpenAI. - С помощью одной демонстрации задачи мы можем воспроизвести её в целом ряде различных начальных условий. Чтобы обучить робота, как построить другую последовательность блоков, нужна только одна дополнительная демонстрация".

Долгосрочная цель исследователей - дать искусственному интеллекту возможность быстро учиться новым действиям и адаптироваться к непредсказуемым изменениям в окружении.

"Младенцы рождаются со способностью подражать тому, что делают другие люди, - говорит Тобин. - Подражание позволяет людям быстро обучаться новым действиям. Мы бы хотели, чтобы так могли обучаться и наши роботы".

Фото: "3Dnews"