Алгоритм глубокого обучения решает кубик Рубика быстрее, чем любой человек

Алгоритм глубокого обучения может решить загадку кубика Рубика за доли секунды. Работа является шагом к созданию систем ИИ, которые могут мыслить, рассуждать, планировать и принимать решения.

С момента своего изобретения венгерским архитектором в 1974 году кубик Рубика сморщил брови многих, кто пытался его решить, но трехмерная логическая головоломка не идет ни в какое сравнение с системой искусственного интеллекта, созданной исследователями из Калифорнийского университета в Ирвине.

DeepCubeA, алгоритм глубокого обучения, запрограммированный учеными и математиками UCI, может найти решение за доли секунды, без каких-либо специальных знаний предметной области или внутриигрового обучения со стороны людей. Это непростая задача, учитывая, что у куба есть пути завершения, исчисляемые миллиардами, но только одно целевое состояние — каждая из шести сторон отображается сплошным цветом — который, очевидно, не может быть найден при случайных движениях.

В исследовании, опубликованном сегодня в Nature Machine Intelligence, исследователи продемонстрировали, что DeepCubeA решает 100 процентов всех тестовых конфигураций, находя кратчайший путь к целевому состоянию примерно в 60 процентах случаев. Алгоритм также работает в других комбинаторных играх, таких как головоломка со скользящей плиткой, Lights Out и Sokoban.

«Искусственный интеллект может победить лучших в мире шахматистов и игроков в го, но некоторые из более сложных головоломок, таких как кубик Рубика, не были решены компьютерами, поэтому мы подумали, что они открыты для подходов ИИ», — сказал старший автор Пьер Балди, UCI Заслуженный профессор компьютерных наук. «Решение кубика Рубика предполагает более символическое, математическое и абстрактное мышление, поэтому машина глубокого обучения, способная взломать такую головоломку, становится ближе к тому, чтобы стать системой, способной мыслить, рассуждать, планировать и принимать решения».

Исследователи интересовались пониманием того, как и почему ИИ делал свои шаги и сколько времени потребовалось, чтобы усовершенствовать его метод. Они начали с компьютерного моделирования завершенной головоломки, а затем взобрались на куб. Как только код был создан и запущен, DeepCubeA обучался в течение двух дней изолированно, решая все более сложные серии комбинаций.

«Он учился сам», — отметил Балди.

Есть некоторые люди, особенно подростки, которые могут быстро решить кубик Рубика, но даже они делают около 50 ходов.

«Наш ИИ занимает около 20 ходов, большую часть времени решая его за минимальное количество шагов», — сказал Балди. «Прямо здесь, вы можете видеть, что стратегия отличается, поэтому я думаю, что форма мышления ИИ полностью отличается от человеческой».

Ветеран компьютерных наук сказал, что конечная цель таких проектов, как этот, состоит в создании следующего поколения систем искусственного интеллекта. Независимо от того, знают они это или нет, искусственный интеллект каждый день затрагивает людей с помощью таких приложений, как Siri и Alexa, и механизмов рекомендаций, работающих за кулисами их любимых онлайн-сервисов.

«Но эти системы не очень умные, они хрупкие, и их легко можно сломать или обмануть», — сказал Балди. «Как нам создать продвинутый ИИ, который будет умнее, надежнее и способен рассуждать, понимать и планировать? Эта работа — шаг к этой здоровенной цели».