Привет, я Артем Дембицкий, аспирант программы «Науки о материалах» и стажёр‑исследователь Центра энергетических технологий Сколтеха, а также младший научный сотрудник команды «Дизайн новых материалов» Института AIRI. Мы с коллегами используем модели машинного обучения для разработки новых материалов с улучшенными свойствами.
Недавно статья с результатами нашего исследования вышла в npj Computational materials — журнале из семейства Nature. Совместными усилиями Сколтеха и AIRI мы оценили применимость машинного обучения для ускоренного поиска литий‑ионных проводников, а также показали практический пример использования универсальных межатомных потенциалов для подбора защитных покрытий катодов твердотельных аккумуляторов.
В этой статье хотелось поделиться подробностями нашей работы, а также в целом рассказать об этих материалах и о том, как их ищут.
Что такое литий-ионные проводники, и зачем они нужны
Мы привыкли связывать электрический ток с движением электронов, что действительно происходит в проводах из металла. Однако способность вещества проводить электричество — его проводимость — может обеспечиваться и другими носителями заряда. Так, ток могут создавать заряженные атомы или молекулы — ионы, если они обладают высокой подвижностью в материале. Такая разновидность проводимости называется ионной, а материалы, где она преобладает, — ионными проводниками. Наконец, если в роли носителей заряда выступают ионы лития, мы имеем дело с проводниками лития — главными героями этой статьи.
Литий‑ионные проводники применяются в различных электрохимических устройствах — газовых сенсорах, мемристорах, электрохромных стеклах. Но самым популярным применением являются, конечно же, литий‑ионные аккумуляторы. Они используются повсеместно — в портативной электронике, бытовой технике, медицинских устройствах, электротранспорте.
После 1991 года, когда эта технология принесла первый коммерческий успех, исследовательская активность в области резко возросла. Потребители постоянно ждут улучшений: хочется, чтобы телефон при тех же габаритах и весе работал не сутки, а неделю, чтобы электромобиль проезжал не 200–400 км, а все 800 на одном заряде, чтобы ноутбук заряжался за 20 минут вместо часа.
Добиться таких улучшений можно за счет инженерных решений, инноваций в конструкции устройств или использования новых материалов. Например, замена жидкого электролита на твердотельный снижает риск возгорания при повреждении аккумулятора, а также повышает его удельную ёмкость за счет более компактной архитектуры и возможности использовать металлический литий в качестве анода (у него самая большая ёмкость среди существующих анодных материалов). Такие аккумуляторы называют твердотельными.
Несмотря на описанные преимущества, твердотельные электролиты обладают более низкой литий‑ионной проводимостью по сравнению с жидкими, что снижает скоростные характеристики устройства — дольше заряжать, меньше мощность. Возникают и другие проблемы: деградация электролита при контакте с активными материалами катода и анода, потеря контакта между частицами катодного вещества и электролитом при заряде/разряде устройства, а также образование литиевых дендритов, которые могут прорастать через электролит и вызывать короткое замыкание. Особо любознательным рекомендую обзор Юргена Янека и Вольфганга Цайера в Nature Energy.
Для решения этих проблем, улучшения рабочих характеристик литий‑ионных (твердотельных) аккумуляторов, а также для повышения их безопасности и долговечности, требуются стабильные материалы, способные быстро проводить ионы лития.
Ионная проводимость в твердых веществах
На атомарном уровне (~10-10 м) твердое кристаллическое вещество — это упорядоченная структура, где ионы расположены периодически в равновесных позициях кристаллической решётки. Вещество становится ионным проводником в том случае, когда ионы приобретают способность перескакивать из одной равновесной позиции в другую (вакантную).

Во время таких перескоков иону необходимо преодолеть энергетический барьер (барьер миграции, ) — это ключевая характеристика ионного проводника, определяющая вероятность перескока и, как следствие, ионную проводимость
:
где — концентрация ионов лития,
— заряд электрона,
— предэкспоненциальный множитель,
— постоянная Больцмана,
— температура.
Ионы лития являются носителями заряда в аккумуляторе. Следовательно, чем выше литий‑ионная проводимость материала при комнатной температуре, тем лучше свойства аккумулятора: мы можем быстрее заряжать устройство, и оно может выдавать больший ток, когда это необходимо. Например, в ситуации, где нам нужно быстро разогнаться на электромобиле при выезде на трассу.
Как искать быстрые ионные проводники?
Поиск материала, удовлетворяющего заданным критериям, — это всегда метод проб и ошибок. Раньше, до появления теоретических методов, ученые использовали химическую интуицию и накопленный годами опыт для выбора материалов‑кандидатов и их последующего синтеза. Для синтезированных материалов ставились эксперименты по измерению ионной проводимости и отбирались наиболее перспективные проводники.
Звучит просто, но порой разработка оптимальной методики синтеза и ее внедрение для массового производства занимает годы (и даже десятилетия) для одного материала. А как быть, если вы планируете проверить 100–200 кандидатов?
На помощь здесь приходит теоретическое моделирование из первых принципов (ab initio). Расчёты свойств материалов на компьютере не только быстрее, но и банально дешевле, чем работа в лаборатории. Правда, напрямую с помощью квантовой механики эту проблему не решить, поскольку уравнение Шрёдингера для большого числа частиц точно мы решать не умеем.
Вместо этого применяют различные приближенные квантовохимические методы компьютерного моделирования материалов, такие как теория функционала плотности (density functional theory, DFT), которые позволяют решить задачу с необходимой точностью за разумное время. С помощью этих методов интересующие нас свойства материалов‑кандидатов можно оценить из модели, а для синтеза и дальнейших экспериментов отобрать только наиболее перспективные варианты. Это позволяет ускорить разработку материалов. Вместе с тем, для уже экспериментально полученных материалов с заданной структурой моделирование позволяет подобрать наиболее перспективный химический состав с наилучшими характеристиками.
Сейчас существует множество баз данных неорганических кристаллических (и не только) структур. Одни базы содержат сведения об экспериментально полученных материалах, другие — наборы гипотетических или теоретически предсказанных структур, полученных с помощью методов квантовой химии. Например, коллекция ICSD содержит >318 000 экспериментально исследованных материалов; в базе данных The Materials Project хранится информация о свойствах >200 000 структур, рассчитанных с помощью теории функционала плотности.
Казалось бы, можно пройтись по этим базам данных, и рассчитать ионную проводимость для интересующих соединений. Однако, когда дело доходит до настолько масштабных расчетов, даже приближенные квантовохимические методы из‑за сложности требуют значительных вычислительных ресурсов.
Например, одним из методов расчёта ионной проводимости является ab initio молекулярная динамика (ab initio molecular dynamics, AIMD). В рамках этого подхода на каждом временнóм шаге рассчитывают силы, действующие на атомы, и интегрируют уравнения движения для определения новых координат атомов на следующем шаге
(
обычно выбирают около 1 фемтосекунды). Это позволяет моделировать эволюцию системы во времени при заданной температуре, отслеживать траектории ионов и анализировать их перескоки, что в конечном итоге дает возможность определить параметры проводимости.
Мне приходилось проводить расчеты для относительно маленькой системы — порядка 100 атомов — на 64 ядрах процессоров Intel Xeon CPU E5–2630 v3 @ 2.40GHz — такие вычисления могут занимать до нескольких месяцев, причем время растёт кубически с увеличением числа электронов в системе (). Сложности добавляет тот факт, что, чем выше барьер миграции
, тем реже происходят перескоки — значит, для получения статистически значимых результатов требуется более длительное моделирование.
Альтернативный подход заключается в оценке не самой ионной проводимости, а только барьера миграции. Для этого строится начальная траектория перескока иона между равновесными позициями (обычно линейной интерполяцией), и оптимизируется (находится положение атомов с минимальной энергией) ряд промежуточных состояний системы вдоль этой траектории. Такой подход называется nudged elastic band (NEB). В результате получается энергетический профиль процесса миграции иона, из которого определяют величину барьера миграции как высоту энергетического профиля.

Хотя величина барьера миграции не дает полной картины даже при фиксированной температуре (помните формулу выше? Есть еще ), этот параметр можно использовать как фильтр для отсева материалов‑кандидатов с заведомо низкой ионной проводимостью, то есть высокими барьерами, ведь проводимость экспоненциально зависит от
.
Такой метод требует кратно меньше ресурсов в сравнении с ab initio молекулярной динамикой, но он все ещё очень затратен, если использовать для расчёта квантовохимические подходы.
Машиннообучаемые межатомные потенциалы
Машиннообучаемые межатомные потенциалы (machine learning interatomic potential, MLIP) изменили подход к моделированию ионной проводимости. Они работают на два‑три (а иногда и больше) порядка быстрее, чем методы квантовой химии, и хорошо масштабируются — временные затраты на моделирование растут почти линейно с размером системы. Это позволяет исследовать системы бо́льших размеров (тысячи атомов) и на более значимых временных промежутках (десятки наносекунд, вместо сотен пикосекунд в первопринципной молекулярной динамике).
В общем виде MLIP — это функция, которая принимает на вход некоторое представление структуры, а на выход выдает полную энергию системы .
Здесь — это обучаемая функция, которая отображает набор векторов между
‑ым атомом и его
‑ыми соседями
и химический состав
соседей (и
‑го атома) во вклад
‑го атома в полную энергию.
Зная эту полную энергию, можно рассчитать силы, действующие на атомы, как антиградиент энергии по координатам атомов (силы можно также предсказывать моделью напрямую, в рамках так называемых unconstrained моделей):
Существуют различные способы представления структуры и кодирования информации о ней: moment tensors, smooth overlap of atomic positions, Behler‑Parrinello symmetry functions и другие. Сейчас на слуху межатомные потенциалы на базе графовых нейросетей (graph neural networks, GNN), использующие представление структуры в виде графа. В таком представлении атомы — это узлы графа, а химические связи между атомами — его ребра. В зависимости от химического элемента и длины связи, узлы и ребра будут иметь разные признаки, подаваемые на вход нейросети.
MLIP'ы обучают на данных, рассчитанных методами квантовой химии, минимизируя функцию потерь для предсказания как энергий, так и сил:
где обозначает предсказание модели,
— число атомов в системе, а
обозначает компоненты вдоль координатных осей.
Да, в таком подходе все еще нужны квантовохимические расчеты, но в существенно меньшем количестве по сравнению с полноценным первопринципным моделированием ионной проводимости. Зато в итоге можно получить потенциал с точностью, близкой к методам квантовой химии, и позволяющий делать крупномасштабные эксперименты с меньшими вычислительными ресурсами. Это дает больше свободы и времени для дальнейших модельных экспериментов.
Зачем нужна универсальность?
MLIP'ы обучают под определенную систему, скажем, под тот же Li3PO4 с картинки выше. Для этого нужно «собирать» (сэмплировать) разные конфигурации структуры, используя первопринципную молекулярную динамику, чтобы накопить хорошую обучающую выборку. Делать это можно поэтапно, пока не будет достигнута желаемая точность в предсказании сил и энергий. Сейчас сэмплирование часто проводят в режиме активного обучения: в обучающую выборку добавляют расчёт для такой конфигурации системы, для которой модель больше всего не уверена в предсказании.
А что если мы хотим изучить 1000 совершенно разных химических систем? Учить столько потенциалов замучаешься.
На помощь приходят универсальные межатомные машинообучамые потенциалы (universal machine learning interatomic potential, uMLIP). Это все те же межатомные потенциалы, но обученные на больших объемах квантовохимических данных, полученных для различных структур и химических составов.
На текущий момент самым популярным является датасет MPTrj от проекта Materials Project с расчетами в рамках теории функционала плотности. Набор содержит около 1 580 000 структур, покрывающих 89 различных химических элементов. Появляются и новые наборы данных, например, MatPES, OMat24 и другие.
Предполагается, что, если модель потенциала обучена на разнообразных данных — разные химические составы, парные взаимодействия, координации атомов и так далее, — то она может обобщаться на новые химические системы и комбинации элементов, которых ранее не встречала в обучающих наборах.
Наша работа
Разработчики универсальных MLIP'ов утверждают, что после обучения на разнообразных квантовохимических данных эти потенциалы могут быть применены «из коробки» для решения различных задач материаловедения, в том числе для оценки ионной проводимости, что может ускорить открытие новых материалов с необходимыми свойствами. Однако до сих пор не было предложено сравнительной схемы для оценки надежности и точности uMLIP'ов в предсказании транспортных свойств литий‑ионных проводников.
За эту задачу мы и взялись. Для этого мы:
Построили набор данных, рассчитанных методом теории функционала плотности. Набор включает почти 2 000 начальных и оптимизированных траекторий (это почти 1 000 000 итераций оптимизации) миграции иона лития в различных кристаллических структурах, покрывающих 45 химических элементов. Набор доступен на github.
Проверили точность существующих uMLIP'ов (M3GNet, CHGNet, MACE‑MP, SevenNet), используя их для оптимизации начальных траекторий и сравнивая с DFT‑данными.
Выявили наиболее перспективные модели — SevenNet и MACE‑MP — и дообучили их на наших данных.
В результате дообученные модели достигли средней абсолютной ошибки предсказания барьера миграции, равной 0.1 эВ, что мы считаем хорошей точностью для проведения масштабного поиска литий‑ионных проводников.

Насколько универсальные межатомные потенциалы быстрее методов квантовой химии, можно оценить хотя бы по следующему сравнению. Мы собирали набор данных три месяца на 960 ядрах Intel Xeon Gold 6278C CPU @ 2.60GHz, используя 30 ядер для каждой траектории (то есть 32 траектории оптимизировались параллельно). Та же задача решается универсальными потенциалами за день на одной видеокарте NVIDIA A100 (с загрузкой GPU ~15%), оптимизируя траектории последовательно (по одной за раз).
Конечно, лучше сравнивать между собой расчёты при одинаковых условиях: или оба на GPU, или оба на СPU. Но дело в том, что современные программные пакеты для квантовохимических расчётов в основном используют CPU. Хотя появляются реализации для GPU, их функционал часто ограничен, а из‑за высокой алгоритмической сложности и необходимости вычислений с двойной точностью (FP64) прирост производительности остаётся умеренным.
Можно ли ускорить еще сильнее?
Для поиска траектории с минимальным барьером миграции нужно оптимизировать геометрию структуры итеративно — считать силы, действующие на атомы, и двигать атомы в направлении действия этих сил. Это похоже на градиентный спуск в машинном обучении, только подгоняются не параметры модели для минимизации функции потерь, а координаты атомов для минимизации энергии системы. Заранее никто не может знать, сколько итераций займет оптимизация, и сойдется ли она вообще.
Вместо использования межатомных потенциалов, можно обучить модель, которая будет предсказывать барьер миграции напрямую по исходной (не оптимизированной) структуре в один шаг. Такой подход называется предсказание «структура‑свойство».
Мы попробовали этот подход на нашем наборе данных. Учитывая, что различных перескоков в структуре может быть больше одного, нужно было как‑то «подсветить» для модели именно тот, для которого мы хотим сделать предсказание. Для этого мы добавляли в структуру атом‑пустышку — «центроид», который находился посередине между исходной и конечной позицией мигрирующего иона.

Анализ весов ребер графа, получившихся на выходе последнего слоя модели (Allegro), показал, что ребра с наибольшими весами (edge weight) соединены с «центроидом» и, следовательно, дают наибольший вклад в предсказание. И чем меньше расстояние (edge length) между «центроидом» и соседним ионом (на картинке это кислород, обозначен красным цветом), тем больше вес, что, в целом, согласуется с физикой — взаимодействие на коротких расстояниях сильнее.
Предсказание в подходе «структура‑свойство» для DFT‑набора данных на GPU занимает около минуты, что гораздо быстрее оптимизации с uMLIP'ами. Однако мы не смогли достичь хорошей точности: ошибка составила 0.4 эВ.
Катодные покрытия для твердотельных аккумуляторов
На следующем шаге мы провели поиск защитных катодных покрытий для твердотельных аккумуляторов. Такие покрытия нужны, чтобы физически разделить твердый электролит и катодный материал. Это позволяет избежать их химического взаимодействия и, как следствие, их деградации и ухудшения рабочих характеристик устройства.
Такие покрытия должны иметь хорошую литий‑ионную проводимость, должны быть термодинамически устойчивы в контакте с электролитом и катодом во всем диапазоне рабочих напряжений аккумулятора, и должны выполнять функцию барьера для электронов.
Поиск вели среди соединений, доступных в базе данных Materials Project, откуда можно также получить информацию об электронных и термодинамических свойствах кандидатов. Чтобы минимизировать временные затраты и компьютерные мощности, использовали многостадийный подход.
На первых стадиях мы отсеивали соединения, не подходящие по элементному составу (дорогие, токсичные, радиоактивные элементы). Затем мы сужали этот список по другим критериям, таким как термодинамическая устойчивость и совместимость с материалами электролита и катода — в нашем случае это были Li10GeP2S12 и LiCoO2, соответственно.
Таким образом, исходный список из 13 000 литийсодержащих соединений был сокращен до около 100 структур, проходящих по нашим критериям (в литературе такое подход называют воронкообразным, funnel approach). Для них мы провели расчет барьеров миграции с помощью дообученного uMLIP'а и предсказали несколько перспективных кандидатов, например, Li3AlF6, LiYF4, Li3PO4, Li2ZnCl4.
Некоторые из них уже были ранее получены и изучены экспериментально. Исследователи предлагали использовать их как защитные покрытия, хотя ионную проводимость не оценивали. Для других соединений в литературе есть квантовохимические расчеты, согласующиеся с нашими предсказаниями. В целом, это подтверждает достоверность нашего подхода.
Заключение
В нашей работе мы показали, что uMLIP'ы можно использовать для высокопроизводительного компьютерного поиска новых литий‑ионных проводников. Разумеется, без экспериментального подтверждения, материалы, отобранные на основе наших предсказаний, остаются лишь кандидатами. Однако теперь таких кандидатов можно находить быстрее и оперативнее переходить к следующему этапу разработки.
Что касается самих uMLIP'ов — совершенству нет предела. Чтобы повышать их точность и скорость работы, необходимо улучшать как архитектуры моделей, так и наборы данных, на которых они обучаются. Надеемся, что наши исследования этому поспособствуют.
Работа была поддержана грантом РНФ.
alnkor
Интересно, как эти модели будуть масштабироваться для структур вне существующих баз? Или полученный список из 100 структур покрывает все пространство. Наверняка некоторые из них уже тестировались, хотелось бы получить экспериментальное подтверждение