ИИ-ученый, который открывает законы природы без участия человека / forpes.ru

Главная
ИИ-ученый, который открывает законы природы без участия человека

ИИ-ученый, который открывает законы природы без участия человека +3

17.10.2025 12:23

andre_dataist 9 2100 Источник

В научных данных часто скрыты простые законы — уравнения, которые объясняют зависимость между величинами. Но найти их непросто: пространство формул огромное, данные бывают шумными, а перебор вариантов быстро захлёбывается. Символическая регрессия как раз и пытается восстановить такую компактную формулу. Многие подходы или перебирают деревья решений, или учат нейросети предсказывать готовые формулы. В обоих случаях LLM обычно лишь подсказывает идеи, а всю логику поиска жёстко задаёт человек.

Авторы SR‑Scientist предлагают иной взгляд: пусть LLM станет автономным учёным. Агент сам анализирует данные, пишет и запускает код, строит и проверяет уравнения, оптимизирует константы и шаг за шагом улучшает гипотезы, опираясь на экспериментальную обратную связь. Вся работа — как у настойчивого исследователя, только в машинном темпе.

Фреймворк вывода SR-Scientist: агент с инструментами анализа данных и оценки уравнений, плюс буфер опыта для длинных сценариев

Как это устроено изнутри.

Агент действует в стиле ReAct: на каждом шаге рассуждает, вызывает инструмент, смотрит на результат и решает, что делать дальше. Инструментов два. Первый — аналитик данных: с помощью кода смотрит статистики и делает выборки. Второй — оценщик уравнений: принимает “скелет” формулы, численно подбирает константы и возвращает метрики. Это избавляет от бесконечного велосипеда в коде и даёт честное сравнение разных гипотез.

У агента есть память — буфер опыта с лучшими уравнениями и их качеством. В новых итерациях модель видит эти находки и целится в более строгую цель по ошибке. Так поддерживается прогресс на длинном сценарии, даже при ограничении на число шагов и вызовов LLM.

Метрика, на которую ориентируется поиск, — MAPE в процентах. Она удобна, когда масштабы данных разные. Для сопоставимости с другими методами дополнительно отбирают формулу с наименьшим NMSE.

Обучение через подкрепление.

Чтобы агент научился не просто “думать вслух”, а системно доводить гипотезу до хорошего результата, авторы строят синтетический учебный набор по четырём дисциплинам и учат политику через Group Relative Policy Optimization. Награда непрерывная: чем ближе к целевому MAPE, тем выше. Важно, что это снижает разреженность сигнала: агент не ждёт редких “побед”, а видит градиент улучшений.

Изменение оценки вознаграждения в процессе обучения

Что показали эксперименты.

Датасет LSR‑Synth покрывает материаловедение, химию, биологию и физику; есть обычные и вне‑доменные тесты. Главная метрика — accuracy‑to‑tolerance: доля примеров, где относительная ошибка укладывается в заданный порог. На таком бенчмарке SR‑Scientist стабильно превосходит бейзлайны. Абсолютный прирост точности — от 6% до 35% в зависимости от домена и модели. На GPT‑OSS‑120B достигается Acc_0.01 = 63.57% и Acc_0.001 = 49.35%. Отдельно заметен вклад обучения с подкреплением: на Qwen3‑Coder‑30B оно поднимает качество во всех дисциплинах.

ID/OOD‑результаты по Acc_0.01 в разных доменах (Qwen3‑Coder‑480B)

Устойчивость к шуму: SR‑Scientist падает меньше конкурентов на разных бэкендах

Важна не только численная точность, но и символическая — совпадение структуры формулы с истинной. Здесь агент тоже впереди: 7–8 точных совпадений против 4–5 у лучших конкурентов на тех же настройках. Авторы показывают кейсы из физики, где найденные выражения совпадают с эталоном по ключевым условиям и физическому смыслу.

Кейсы из физики: найденные уравнения совпадают по важным условиям с эталонными

Что влияет на успех

Абляции честно показывают слабые места. Если выкинуть анализ данных, качество заметно падает: агенту трудно понять, где и почему ошибается гипотеза. Если убрать буфер опыта, прогресс рвётся — удачные формы не протаскиваются между итерациями. Ещё один практический момент — баланс длины сценариев и числа итераций: после ~25 шагов на попытку лучше инвестировать ресурс в дополнительные итерации, а не в сверхдлинные рассуждения.

Баланс между числом ходов и итерациями при ограниченном бюджете вызовов LLM

Почему это важно

Большая языковая модель здесь не генератор красивых формул, а активный участник научного процесса. Она строит модель мира на лету: из данных — к гипотезам, через код — к проверке, по обратной связи — к улучшению. Минимум ручного оркестрирования, максимум автономии. Именно такой дизайн и усиливается RL‑обучением: агент учится мыслить длиннее и действовать эффективнее.

Вывод по сути прост: если дать LLM правильные инструменты и научить её жить в длинном горизонте, она начинает работать как внимательный исследователь. SR‑Scientist демонстрирует прирост точности, лучшую переносимость, устойчивость к шуму и более высокую символическую точность — всё то, что важно в реальном научном применении.

? Полная статья

? Код

***

Если вам интересна тема ИИ, подписывайтесь на мой Telegram‑канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Комментарии (9)

VAF34
17.10.2025 12:30
#28974976
Без любопытства не может быть никакого открытия. Где любопытство у автомата? И, вообще, возможно ли любопытство у автомата.
1. n0isy
  17.10.2025 12:30
  #28975038
  "Я согжу твой сервер, если ты не изобретешь что-то новенькое".
  
  Хммм... Любопытно...
1. Hardcoin
  17.10.2025 12:30
  #28975156
  Необоснованное утверждение. Вам просто интуиция подсказывает, что «любопытство» - необходимый компонент. Обосновать научно вы вряд ли сможете.
  1. VAF34
    17.10.2025 12:30
    #28977356
    Любопытство заставляет действовать, выбирать направление действия, ничего подобного у современных вариантов ИИ конкретно поясненного я не встречал.

Grey83
17.10.2025 12:30
#28975000
который открывает законы природы

Но пока ни одного так и не открыл?

без участия человека

Т.е. человек не участвует ни при создании запроса, ни при интерпритации и проверке полученого результата?
1. n0isy
  17.10.2025 12:30
  #28975396
  Ещё бегает, где-то: мешается, вопросы глупые задаёт, публикации в архив делает, выдавая их за свои /s

Einherjar
17.10.2025 12:30
#28975034
ИИ даже в powershell-скриптах упорно комментарии через // вместо # пишет, открытия с такими инструментами это где то рядом с бесконечным числом обезъян которые напишут "войну и мир".
1. retinoblastoma
  17.10.2025 12:30
  #28984378
  Так смысл то верный подставлен, и то коммент и то коммент. Фуллстек программисты сами часто так путают, какой тут надо ставить символ коммента, если без IDE писать...
  
  Есть ли правильное векторение, что используем powershell? Что в системном промте и самом вопросе задачи при таких глюках?

Astrowalk
17.10.2025 12:30
#28975676
Лем и это предвидел, назвав "выращиванием информации".