Игра в шахматы требует от игроков умения думать на несколько ходов вперёд, и этот навык с годами освоили компьютерные программы. Ещё в 1996 году суперкомпьютер IBM обыграл тогдашнего чемпиона мира по шахматам Гарри Каспарова в знаменитом матче. Позже, в 2017 году, программа искусственного интеллекта (ИИ), разработанная Google DeepMind, под названием AlphaZero, победила лучшие компьютерные шахматные движки того времени, обучившись игре за считанные часы.
Совсем недавно некоторые математики начали активно обсуждать вопрос о том, могут ли программы искусственного интеллекта также помочь в решении самых сложных математических задач в мире. Но если средняя партия в шахматы длится около 30-40 ходов, то математические задачи исследовательского уровня требуют решений, которые занимают миллион и более шагов, или ходов.
В статье, опубликованной на сервере препринтов arXiv, команда под руководством Сергея Гукова, профессора теоретической физики и математики Джона Д. Макартура из Калтеха, описывает разработку нового типа алгоритма машинного обучения, который может решать математические задачи, требующие чрезвычайно длинных последовательностей шагов. Команда использовала свой новый алгоритм для решения семейств задач, связанных со всеобъемлющей математической проблемой десятилетней давности под названием «гипотеза Эндрюса-Кертиса». По сути, алгоритм может мыслить гораздо дальше, чем даже такие продвинутые программы, как AlphaZero.
«Наша программа нацелена на поиск длинных и редких последовательностей шагов, которые трудно найти, — говорит первый автор исследования Али Шехпер, постдокторант Ратгерского университета, который вскоре присоединится к Калтеху в качестве научного сотрудника. — Это всё равно что пытаться найти дорогу в лабиринте размером с Землю. Это очень длинные пути, которые нужно проверить, и есть только один путь, который работает».
Использование искусственного интеллекта для решения математических задач становится всё более популярным. AlphaProof компании Google DeepMind показал результат на уровне серебряного призёра на Международной математической олимпиаде 2024 года — математическом соревновании для старшеклассников. А программа o3 компании OpenAI недавно справилась с эталонными задачами по математике, естественным наукам и компьютерному программированию.
Математики из Калифорнийского технологического института сосредоточились не на рутинных проблемах, а на самых сложных в своей области. В новом исследовании они использовали искусственный интеллект для решения двух семейств задач в рамках гипотезы Эндрюса-Кертиса — проблемы теории групп, впервые предложенной 60 лет назад.
Хотя им не удалось решить саму гипотезу, они опровергли несколько семейств проблем, которые рассматривались как потенциальные контрпримеры. Эти проблемы оставались нерешёнными в течение примерно 25 лет. Они также добились значительного прогресса в решении другого семейства контрпримеров, которое оставалось нерешённым в течение 44 лет. Контрпримеры — это, по сути, математические случаи, которые опровергают исходную гипотезу. Если сами контрпримеры опровергнуты, то первоначальная гипотеза может быть верной.
«Исключение некоторых контрпримеров даёт нам уверенность в справедливости исходной гипотезы и помогает укрепить нашу интуицию в отношении основной проблемы. Это даёт нам новые способы думать о ней», — говорит Шехпер.
Гуков говорит, что решение этих математических задач похоже на «движение из пункта А в пункт Б» по запутанным маршрутам, требующим тысячи, миллионы или даже миллиарды шагов. Он сравнивает эти проблемы с решением невероятно сложного кубика Рубика.
«Можете ли вы взять этот сложный кубик Рубика и вернуть его в исходное состояние? Вы должны отработать очень длинные последовательности ходов, и вы не будете знать, на правильном ли вы пути, до самого конца», — говорит Гуков, который также является директором нового Центра чистой и прикладной математики имени Ричарда Н. Меркина в Калифорнийском технологическом институте.

Программа искусственного интеллекта команды научилась придумывать длинные последовательности ходов, которые исследователи называют «суперходами» — причём эти последовательности оказались неожиданными, или как говорят исследователи, «аутсайдерами». Это контрастирует с тем, как работают ИИ, подобные ChatGPT.
«Если вы попросите ChatGPT написать письмо, он придумает что-то типичное. Вряд ли он придумает что-то уникальное и очень оригинальное. Это просто хороший попугай, — говорит Гуков. — Наша программа умеет придумывать необычные решения».
Для обучения ИИ исследователи использовали модель машинного обучения, известную как обучение с подкреплением. Сначала команда показывала ИИ лёгкие задачи, которые нужно было решить, а затем постепенно давала ему всё более трудные задачи.
«Он пробует различные ходы и получает вознаграждение за решение задач, — объясняет Шехпер. — Мы поощряем программу делать больше того же самого, сохраняя при этом определённый уровень любопытства. В итоге она разрабатывает новые стратегии, которые лучше тех, что может сделать человек. В этом и заключается магия обучения с подкреплением».
В настоящее время ИИ, как правило, не очень хорошо справляются с предсказанием редких событий, имеющих драматические последствия, таких как крах на финансовом рынке. Новый алгоритм команды также не может делать подобные прогнозы, но в нём могут содержаться зачатки того, что необходимо для разумных предсказаний такого рода. «По сути, наша программа знает, как научиться учиться, — говорит Гуков. — Она мыслит нестандартно».
Новый алгоритм команды уже произвёл фурор в математическом сообществе.
«Мы провели много улучшений в области математики, которой уже несколько десятилетий, — говорит Гуков. — Прогресс был относительно медленным, но теперь он весь бурлит».
К команде присоединились три новых математика: Лукас Фаган и Чжэньган Ван из Калифорнийского университета в Санта-Барбаре, а также Ян Цю из Нанкайского университета в Тяньцзине (Китай) — и группа опубликовала ещё одну препринтную работу, в которой сообщается о решении ещё большего числа семейств потенциальных контрфактов, принадлежащих гипотезе Эндрюса-Кертиса.
Вместо того чтобы масштабировать модели ИИ, команда стремится найти новые хитроумные трюки и стратегии, не требующие больших вычислительных мощностей.
«Мы стараемся продемонстрировать хорошую производительность на небольших компьютерах, легко доступных для небольших академических групп, чтобы любой из наших коллег по всему миру мог легко воспроизвести эти результаты», — говорят исследователи.
Norton2025
Искусственный интеллект — это неизбежность.