В конце ноября Google DeepMind сообщила об открытии сотен тысяч новых стабильных материалов с помощью нейросети Graph Networks for Materials Exploration (GNoME) ― сервиса для предсказания неорганических кристаллических структур. Сами разработчики в статье в Nature говорят об экономии 800 лет научных исследований.

В этой статье разберем, что эта новость означает с точки зрения химика и как может быть полезна научным группам ИТМО.

Почему создавать материалы сложно

Разработка нового материала отнимает у ученых годы исследований. Как правило, за основу берут существующий материал с определенными свойствами и начинают постепенно модифицировать один из его параметров, проверяя, какие свойства будут у результата. Не всегда модификации ведут в нужном направлении. Если требуемые свойства получить не удается, приходится брать за основу другой материал (или варьировать какие-то другие параметры). В таком режиме до появления новой стабильной кристаллической структуры, соответствующей ожиданиям исследователей, могут пройти месяцы, а иногда и годы.

Идея использовать различные алгоритмы, упрощающие и автоматизирующие поиск стабильных кристаллических структур, лежит на поверхности. До появления нейросетей с этой целью активно применялись генетический и эволюционный алгоритмы. Они на каждом этапе генерации просто меняют один из параметров кристаллической решетки, например расстояние между атомами, и помогают таким образом быстрее обнаруживать стабильную структуру с нужными свойствами.

Применить искусственный интеллект для того, чтобы генерировать подобные структуры в автоматическом режиме, догадались еще в 2011 году. В той работе ученые построили модель, которая могла предсказывать кристаллическую структуру по определенным начальным данным. Впоследствии разные научные группы повторяли этот подход, но чаще применяли его к материалам определенного типа (с нужными свойствами и возможным спектром применений).

Нейросети в данной сфере ― не такое уж простое решение. Чтобы генеративный алгоритм работал корректно, нейросети нужно большое количество данных для обучения. Однако для кристаллов обеспечить этот набор данных непросто. В научных работах гораздо чаще можно встретить описание генерации молекул, потому что данных о молекулах намного больше и более или менее понятно, как с ними работать. Что же касается данных о кристаллических системах, то их меньше, а самое главное ― их свойства сложно унифицировать. Применительно к модели не ясно, какие параметры этой мультиэлементной системы играют наибольшую роль.

В Google DeepMind посмотрели на вопрос шире, взяв в качестве основы генерации две большие базы данных по материалам, которые есть в открытом доступе ― базу Materials Project, а также открытую квантово-химическую БД. К слову, Materials Project ― пожалуй, самая большая из доступных баз, но в основном она специализируется на катализе.

К унифицированным данным применили многослойные перцептроны. Использовали сразу 10 различных нейросетей, чтобы минимизировать вероятность ошибки в каждой из них. Кроме того, добавили методы проверки, которые позволили сделать сгенерированные структуры жизнеспособными.

Что под капотом

Graph Networks for Materials Exploration (GNoME) представляет кристаллическую структуру в виде графа, предлагая свой собственный способ кодирования различных композитов. Узлы графа ― атомы кристаллической решетки, а ребра показывают межатомные расстояния. При этом на генерацию структур накладывались некоторые дополнительные условия, в частности, симметрия элементарной ячейки.

По сути эта модель не несет в себе ничего сверхнового - она использует те же подходы, что применялись в статье 2011 года. Однако принципиально другим оказался комплексный подход к вопросу. В случае с Google DeepMind для получения именно стабильных структур использовалось два конвейера ― один для генерации структур, другой ― для оценки стабильности с использованием нейронной сети и дополнительно с помощью  квантово-химических расчетов, основанных на теории функционала плотности.

Иллюстрация из статьи
Иллюстрация из статьи

Всю эту работу специалисты GNoME объединили в цикл, обеспечив непрерывное обучение. Кристаллические решетки, для которых квантовые расчеты предсказывали стабильность, использовались для дообучения изначальной модели. Замкнутый пайплайн помог дальше отойти от уже сгенерированных структур, внося больше изменений в параметры кристаллической структуры.

В общей сложности GNoME обнаружил 2.2 млн материалов, 380 тыс. из которых можно назвать наиболее вычислительно стабильными (т.е. не разлагающимися на аналогичные составы с меньшей энергией). Эти 380 тыс. структур будут выложены в базу данных Materials Project. Но пока это лишь теоретически обнаруженные материалы. Дальше специалисты, работающие в определенных направлениях, могут выбрать для себя интересный вариант и попробовать синтезировать его в лаборатории, поскольку одно дело ― теоретически рассчитанная стабильность одной элементарной ячейки кристаллической решетки, но совсем другое ― материал в объеме и в рамках реального применения. Для этого необходимо определить целевое свойство и пройтись по базе Materials Project со своими моделями и расчетами, чтобы выбрать наиболее подходящего кандидата для исследований. Возможно, проверкой теоретически рассчитанных свойств на практике также займутся автоматизированные лаборатории.

Некоторые из предсказанных материалов уже получены экспериментально. Работа над GNoME началась в 2021 году. Но за эти 2 года объем материалов, исследованных другими группами, также увеличился. Некоторые из новых открытых на практике структур были независимо предсказаны GNoME.

Шесть примеров кристаллов, которые независимо были открыты другими группами
Шесть примеров кристаллов, которые независимо были открыты другими группами

В Центре искусственного интеллекта в химии ИТМО мы работаем с материалами для различных применений в большей степени с точки зрения практики. У нас много проектов , каждый из которых решает свою задачу. Кто-то ищет материалы для замены природных ферментов и, соответственно, таких специалистов интересуют материалы с высокой каталитической активностью, похожей на активность природных аналогов. Другие ― синтезируют для последующих применений магнитные наноматериалы, т.е. предсказывают магнитные свойства новых систем. 

Найденные GNoME кристаллические системы потенциально позволят нам расширить спектр материалов, которые мы рассматриваем под новые области, поскольку используемый коллегами механизм был заточен на то, чтобы создавать как можно более разнообразные структуры. Наши научные группы смогут искать в базе соединения с уникальными свойствами и дальше работать с ними. По сути GNoME упростил нам путь к новым материалам.

Комментарии (4)


  1. hurtavy
    11.01.2024 12:30

    А нейронка не подсказывает методы синтеза?


    1. vesper-bot
      11.01.2024 12:30
      +2

      А она о них знать не может. Её просили посчитать метастабильные неорганические структуры, а то, что до этого состояния может не быть реальных переходов из суммы исходных веществ, ей по барабану.


  1. azTotMD
    11.01.2024 12:30
    +1

    взяв в качестве основы генерации две большие базы данных по материалам, которые есть в открытом доступе ― базу Materials Project, а также открытую квантово-химическую БД.

    В общей сложности GNoME обнаружил 2.2 млн материалов, 380 тыс. из которых можно назвать наиболее вычислительно стабильными (т.е. не разлагающимися на аналогичные составы с меньшей энергией). Эти 380 тыс. структур будут выложены в базу данных Materials Project.

    потом эти сгенерированные структуры попадут в обучающий датасет, нагенерируют новых структур и снова загрузят в базу. Через пару итераций базы данных будут сплошь состоять из вот таких вот "кристаллов", возможность сущестования которых так и не будет проверена


    1. Wizard_of_light
      11.01.2024 12:30

      Мне кажется тут не так страшно, устойчивость же не методом нейросетевых глюков проверяют, а квантовомеханическим расчётом. Обучение только для ограничения зоны поиска проводится, чтобы не сплошняком прочёсывать все возможные варианты, а направленно ковыряться в наиболее перспективных областях.