Система машинного обучения, изначально созданная для ускорения вычислений, сегодня делает удивительные успехи на границах экспериментальной квантовой физики. Квантовый физик Марио Кренн помнит, как в начале 2016 года он сидел в кафе в Вене и просматривал компьютерные распечатки, пытаясь понять смысл того, что обнаружил MELVIN. MELVIN — написанный Кренном алгоритм машинного обучения, своего рода искусственный интеллект. Его задача — смешивать и сопоставлять строительные блоки стандартных квантовых экспериментов и находить решения новых проблем; он нашёл много интересного, но имело место и одно странное решение. К старту курса о глубоком и машинном обучении делимся переводом статьи о квантовых экспериментах при помощи ИИ.
«За несколько часов программа нашла решение, к которому мы, учёные — три экспериментатора и один теоретик — не могли прийти месяцами, — рассказывает Кренн. — День был сумасшедшим. Не мог поверить, что это произошло».
«Первой мыслью было: “В моей программе баг, потому что решения быть не может”», — рассказывает Кренн. MELVIN, казалось бы, решил проблему создания очень сложных запутанных состояний с участием нескольких фотонов (запутанные состояния — это именно то, что когда-то заставило Альберта Эйнштейна взывать к призраку «жуткого действии на расстоянии»).
Марио Кренн, Антон Цайлингер из Венского университета и их коллеги не ограничивали MELVIN явными, необходимыми для генерации таких сложных состояний правилами, Кренн понял, что алгоритм заново открыл придуманный в 1990-х годах тип экспериментальной расстановки. Но эксперименты того времени были намного проще, а MELVIN разгадал загадку гораздо сложнее.
«Осознав происходящее, мы сразу же смогли обобщить [решение]», — рассказывает Кренн, сегодня работающий в Университете Торонто. С того момента другие команды стали проводить определённые MELVIN эксперименты, что позволило иными способами проверить концептуальные основы квантовой механики.
Тем временем, работая с коллегами в Торонто, Кренн усовершенствовал алгоритмы машинного обучения. Их последняя работа — ИИ THESEUS, который повысил уровень сложности экспериментов: он гораздо быстрее, чем MELVIN, при этом, чтобы понять блуждания MELVIN, Кренну и его коллегам потребовались бы дни или даже недели, но выводы THESEUS учёные могут понять почти сразу.
«Работа потрясающая!», — уверен физик-теоретик Ренато Реннер из Института теоретической физики при Швейцарском федеральном технологическом институте, который рецензировал исследование 2020 года о THESEUS, но не принимал в этих работах непосредственного участия.
Кренн наткнулся на эту исследовательскую программу почти случайно, когда он и его коллеги пытались выяснить, как экспериментально получить квантовые состояния запутанных очень специфическим образом фотонов.
Начальные сведения
Взаимодействуя, два фотона запутываются, описать их математически можно только с помощью одного общего квантового состояния. Измеряя состояние одного фотона, самим фактом измерения учёный мгновенно фиксирует состояние другого фотона, даже если фотоны разделены километрами (отсюда и насмешливые комментарии Эйнштейна о том, что спутанность — это «жуть»).
В 1989 году три физика — Дэниел Гринбергер, покойный Майкл Хорн и Цайлингер — описали запутанное состояние, которое позже стало известно как GHZ (по инициалам учёных). Участвовали четыре фотона, каждый мог находиться в квантовой суперпозиции, скажем, двух состояний, 0 и 1 (такое состояние называется кубит). В их работе состояние GHZ подразумевало запутывание четырёх кубитов таким образом, что вся система находилась в двумерной квантовой суперпозиции состояний 0000 и 1111. Если бы вы измерили один из фотонов и обнаружили, что он находится в состоянии 0, суперпозиция разрушилась бы и другие фотоны также оказались бы в состоянии 0. То же самое произошло бы и при состоянии 1. В конце 1990-х годов Цайлингер и его коллеги впервые экспериментально наблюдали GHZ-состояния трёх кубитов.
Кренн и его коллеги стремились получить GHZ с большим количеством кубитов. Они хотели работать с тремя фотонами, где каждый фотон имеет размерность состояния три, — это означает, что он может находиться в суперпозиции трёх состояний: 0, 1 и 2. Такое квантовое состояние называется кутрит. Запутанность, которой хотела добиться команда, представляла собой трёхмерное состояние GHZ, являющееся суперпозицией состояний 000, 111 и 222. Такие состояния — важный компонент безопасной квантовой связи и ещё более быстрых квантовых вычислений.
В конце 2013 года исследователи потратили несколько недель на разработку экспериментов на меловых досках и проведение расчётов, чтобы проверить, могут ли их установки генерировать необходимые квантовые состояния. Но всякий раз учёные терпели неудачу. «Я думал: “Это сумасшествие. Почему мы не можем придумать установку?”» — рассказывает Кренн.
Чтобы ускорить процесс, сначала Кренн написал компьютерную программу, которая на входе получала экспериментальную установку и рассчитывала результат. Затем он усовершенствовал программу так, чтобы она могла включать в свои расчёты строительные блоки, с которыми для создания и манипулирования фотонами на оптической скамье работают экспериментаторы: лазеры, нелинейные кристаллы, расщепители луча, фазовращатели, голограммы и тому подобное. Программа вела поиск по большому пространству конфигураций, случайным образом комбинируя и сопоставляя блоки, выполняла вычисления и выдавала результат. Родился MELVIN.
Затем Кренн прибавил системе MELVIN ума. Находя полезную конфигурацию, MELVIN стал добавлять её в свой набор инструментов. «Алгоритм запоминает конфигурации и пытается повторно применить её в решениях сложнее», — говорит об этом Кренн.
Новый MELVIN заставил Кренна задуматься в венском кафе. Физик запустил его с экспериментальным набором инструментов, содержащим два кристалла, каждый из которых был способен порождать пару спутанных в трёх измерениях фотонов.
Кренн наивно предполагал, что MELVIN найдёт конфигурации, объединяющие эти пары фотонов и создающие запутанные состояния не более чем 9 измерений. Но «на самом деле было найдено одно решение, крайне редкий случай; в сравнении с другими решениями оно имеет гораздо более высокую запутанность», — заявил Кренн.
В конце концов учёный выяснил, что MELVIN использовал метод, который несколько команд разработали почти три десятилетия назад. В 1991 году один из методов был разработан Синь Юй Цзоу, Ли Цзюнь Вангом и Леонардом Манделом, работавшими в то время в Рочестерском университете. В 1994 году Цайлингер, занятый тогда в Инсбрукском университете в Австрии, и его коллеги придумали другой метод.
Концептуально эксперименты оказались чем-то схожими, но разработанную Цайлингером и его коллегами конфигурацию проще было понять. Конфигурация начинается с одного кристалла, генерирующего пару фотонов (A и B). Пути этих фотонов проходят прямо через другой кристалл, который также может генерировать два фотона (C и D). Пути фотона A из первого кристалла и фотона C из второго точно пересекаются и ведут к одному и тому же детектору. Если этот детектор срабатывает, то невозможно определить, откуда исходит фотон — из первого или второго кристалла. То же самое относится к фотонам B и D.
Фазовращатель — это устройство, эффективно увеличивающее пройденный фотоном путь на некоторую долю длины волны. Если в один из путей между кристаллами ввести фазовый сдвиг и продолжать изменять его величину, на детекторах можно вызвать конструктивные и деструктивные помехи. Например, каждый из кристаллов может генерировать, скажем, 1 000 пар фотонов в секунду. При конструктивной интерференции детекторы будут регистрировать 4 000 пар фотонов в секунду. А при деструктивном вмешательстве они не обнаружат ни одного: система в целом не создаст ни одного фотона, даже если отдельные кристаллы будут порождать 1000 пар в секунду. «Если подумать, то это просто безумие», — рассказывает Кренн.
Забавное решение MELVIN содержит такие пересекающиеся дорожки. Кренна смутило то, что в инструментарии алгоритма было всего два кристалла. И, вместо того чтобы поместить эти кристаллы в начале экспериментальной установки, он поместил их внутрь интерферометра (устройства, которое разделяет путь, скажем, фотона на два, а затем рекомбинирует их).
После долгих усилий он понял, что найденная MELVIN установка эквивалентна установке, содержащей более двух кристаллов, каждый из которых порождает пары фотонов так, что их пути к детекторам пересекаются. Эта конфигурация может применяться для создания запутанных состояний высокой размерности.
Квантовый физик Нора Тишлер, которая была аспирантом доктарантуры, когда MELVIN проходил испытания, работала с Цайлингером над несвязанной темой и обратила внимание на эти события. «С самого начала было ясно, что такого эксперимента не существовало бы, если бы его не обнаружил алгоритм», — утверждает она.
Помимо генерации сложных запутанных состояний установка с более чем двумя кристаллами и с перекрывающимися путями может использоваться для выполнения обобщённой формы квантовых интерференционных экспериментов Цайлингера 1994 года с двумя кристаллами. Эфраим Стейнберг, экспериментатор из Университета Торонто, коллега Кренна, но не работавший над этими проектами, впечатлён тем, что обнаружил ИИ. «Это обобщение, которое (насколько мне известно) ни один человек не придумал за прошедшие десятилетия и, возможно, никогда не придумает, — рассказывает он. — Это великолепный первый пример того, к каким новым исследованиям могут привести нас эти мыслящие машины».
В одной из таких обобщённых конфигураций с четырьмя кристаллами, каждый из которых генерирует пару фотонов, и перекрывающимися путями, ведущими к четырём детекторам, квантовая интерференция может создавать ситуации, когда-либо все четыре детектора срабатывают (конструктивная интерференция), либо этого не происходит вообще (деструктивная интерференция).
Но до недавнего времени проведение такого эксперимента оставалось далёкой мечтой. Затем, в мартовской препринтной статье, группа под руководством Лан-Тянь Фенга из Университета науки и технологии Китая в сотрудничестве с Кренном сообщила, что они изготовили установку целиком на одном фотонном чипе и провели эксперимент. Исследователи собирали данные в течение более чем 16 часов: это стало возможным благодаря невероятной оптической стабильности фотонного чипа, которой невозможно было бы достичь в более масштабном, проводимом ради предположений эксперименте.
Для начала, по словам Стейнберга, установке потребуется квадратный метр оптических элементов, точно выровненных на оптической скамье. Кроме того, говорит он, «одного колебания или смещения оптического элемента на тысячную долю диаметра человеческого волоса в течение этих 16 часов может быть достаточно, чтобы разрушить эффект».
Во время своих ранних попыток упростить и обобщить то, что нашёл MELVIN, Кренн и его коллеги поняли, что решение напоминает абстрактные математические формы, называемые графами, которые содержат вершины и ребра и используются для изображения парных отношений между объектами. В этих экспериментах каждый путь, который проходит фотон, представлен вершиной. А кристалл, например, представлен ребром, соединяющим две вершины. MELVIN сначала создал такой граф, а затем выполнил над ним математическую операцию. Эта операция, называемая «совершенное паросочетание», заключается в создании эквивалентного графа, где каждая вершина соединена только с одним ребром. Этот процесс значительно упрощает вычисление конечного квантового состояния, хотя его всё ещё трудно понять человеку.
Ситуация изменилась с появлением преемника MELVIN — THESEUS, который генерирует гораздо более простые графы, очищая первый сложный граф, представляющий найденное решение, до минимального количества рёбер и вершин (так, что любое дальнейшее удаление лишает установку способности генерировать желаемые квантовые состояния). Такие графы проще графов совершенного паросочетания MELVIN, поэтому разобраться в любом решении THESEUS ещё проще.
Реннер особенно впечатлён результатами работы THESEUS, интерпретируемыми человеком. «Решение разработано таким образом, что количество связей в графе сведено к минимуму, — рассказывает он. — И, естественно, такое решение мы можем понять лучше, чем если бы граф был очень сложным».
Эрик Кавальканти из Университета Гриффита в Австралии одновременно впечатлён работой и осторожен в её отношении. «Эти методы машинного обучения — интересная разработка. Для изучающего и интерпретирующего данные человека некоторые решения могут выглядеть как новые, «творческие». Но на данном этапе эти алгоритмы ещё далеки до уровня, когда можно было бы сказать, что у них появляются действительно новые идеи или возникают новые концепции, — утверждает он. — С другой стороны, я думаю, что однажды они придут к этому. Это маленькие шаги, но мы должны с чего-то начинать».
Штейнберг соглашается с Кавальканти: «Пока что это просто потрясающие инструменты, И, как все лучшие инструменты, они уже позволяют нам делать некоторые вещи, которые мы, вероятно, не сделали бы без них».
Мы уже писали об изощрённости искусственного интеллекта, а сегодня она — как минимум инструмент науки, и, если сфера ИИ вам интересна, вы можете присмотреться к курсу о машинном и глубоком обучении, а если вы предпочитаете мыслить самостоятельно, то можете обратить внимание на наш флагманский курс о Data Science, где вы получите опыт, эквивалентный трём годам активного изучения науки о данных.
Узнайте, как прокачаться и в других специальностях или освоить их с нуля:
Другие профессии и курсы
ПРОФЕССИИ
КУРСЫ
plus79501445397
Вот пара ссылок на THESEUS (их нет почему-то и в оригинале), если кому-то интересно.