Рубрики
МЕНЮ
Виталий Войчук
Команда разработчиков сосредоточилась на режиме захват флага, в котором карта меняется от игры к игре, сообщает "Новое время".
Персонажи, которые управлялись искусственным интеллектом, должны были изучить общие стратегии, чтобы иметь возможность адаптироваться к каждой новой карте. Людям сделать это намного проще. Агентам DeepMind необходимо как сотрудничать с членами команды, так и конкурировать с противоположной командой и быть в состоянии адаптироваться к различным стилям игры противника.
"Наши агенты должны учиться с нуля, как видеть, действовать, сотрудничать и конкурировать в невидимых средах, все из одного сигнала подкрепления за матч: выиграла ли их команда или нет", — пишут исследователи в блоге.
Авторы работы использовали обучение с подкреплением (англ.reinforcement learning) — вид машинного обучения, при котором алгоритм обучается, не имея при этом обучающей выборки в виде пары "входные данные — ответ". Компьютер получает отклик от среды — например, очки за успешное прохождение уровня или штрафные баллы за ошибки — и благодаря этому улучшает свою работу.
Исследователи обнаружили, что персонажи под управлением искусственного интеллекта выигрывают чаще, чем люди, но они также более дружелюбны, чем люди. Персонажи также выучили человеческое поведение — например, следовать за игроками своей команды и занимать базу врага. По словам создателей, в будущем новая система искусственного интеллекта, вероятно, может быть адаптирована и для более сложных игр, например StarCraft II или Dota 2.
Фото: 21cbr.com
Новости партнеров
Новости