Этим летом таблетка, предназначенная для лечения хронического, пока неизлечимого заболевания лёгких, вошла в среднюю фазу испытаний на людях. Предыдущие исследования показали, что препарат безопасен при проглатывании, но улучшит ли он симптомы болезненного фиброза, на который нацелен, пока неизвестно; это и предстоит выяснить в ходе нынешних испытаний, которые, возможно, закончатся в следующем году. Такое предварительное достижение вряд ли заслуживало бы внимания, если бы не один нюанс в происхождении лекарства: это, вероятно, первое лекарство, полностью разработанное искусственным интеллектом, которое зашло так далеко в разработке.

Создатель таблетки, биотехнологическая компания Insilico Medicine, использовала сотни моделей искусственного интеллекта, чтобы найти новую мишень в организме, способную помочь в лечении фиброза, и определить, какие молекулы можно было бы синтезировать для получения лекарства. Эти программы позволили Insilico пройти путь от нуля до запуска препарата в первую фазу испытаний на людях за два с половиной года, а не за пять, как это обычно бывает. Даже если таблетка окажется бесполезной, что вполне реально, на подходе уже множество других лекарств, разработанных с помощью искусственного интеллекта. Учёные и компании надеются, что они доберутся до аптек гораздо быстрее, чем традиционные лекарства, на вывод которых на рынок обычно уходит более десяти лет, а процент неудач которых очень высок.

Медицина — лишь один из аспектов масштабных преобразований в науке. Только за последние несколько месяцев ИИ стал предсказывать тропические штормы с такой же точностью и гораздо быстрее, чем обычные модели; компания Meta1выпустила модель, которая может анализировать снимки мозга, чтобы воспроизвести то, на что смотрит человек; Google недавно использовала ИИ, чтобы найти миллионы новых материалов, которые могут улучшить суперкомпьютеры, электромобили и многое другое. Подобно тому, как технология стирает границы между текстом и изображениями, созданными человеком и компьютером, меняя способы работы, обучения и общения людей, инструменты ИИ ускоряют и изменяют некоторые базовые элементы науки. «Мы действительно можем совершить открытия, которые были бы невозможны без использования ИИ», — сказала мне Маринка Зитник, исследователь биомедицины и ИИ в Гарварде.

Наука никогда не была такой быстрой, как сегодня. Но внедрение ИИ также в некотором смысле делает науку менее человечной. На протяжении веков познание мира основывалось на наблюдении и объяснении. Многие из современных моделей ИИ искажают это стремление, предоставляя ответы без обоснования и заставляя учёных изучать собственные алгоритмы так же, как они изучают природу. При этом ИИ, возможно, бросает вызов самой природе открытий.


ИИ существует для того, чтобы выводить невероятно сложные закономерности из наборов данных, которые слишком велики для человека, чтобы их постичь. Это мистическое явление стало более привычным после появления ChatGPT в прошлом году. Чат-бот — инструмент, внезапно оказавшийся у каждого под рукой и, кажется, синтезирующий весь интернет, — изменил наши способы доступа к знаниям и их применения, но в то же время запятнал большую часть нашего мышления сомнениями. Мы не понимаем, как именно генеративные чат-боты с искусственным интеллектом составляют свои ответы, — только то, что они звучат удивительно по-человечески, из-за чего очень трудно понять, что теперь реально, логично или заслуживает доверия, а также является ли текст, даже наш собственный, полностью человеческим или имеет кремниевый привкус. Когда ответ оказывается осмысленным, может показаться, что он предлагает срезать путь, и не даёт истинного понимания того, как и почему он был получен.

ИИ, вероятно, делает нечто подобное в широком спектре научных дисциплин. Среди наиболее заметных научных достижений, полученных с помощью ИИ, можно назвать результаты в области молекулярной биологии от DeepMind, ведущей исследовательской лаборатории ИИ, которая теперь базируется в Google. После того как в 2016 году программа DeepMind победила в игре го — игре, которая настолько сложнее шахмат, что многие считали, что компьютеры никогда не смогут её освоить, — Демис Хассабис, генеральный директор DeepMind, рассказал мне, что он начал думать о том, как создать программу ИИ для решения задачи фолдинга белков, которая существует уже несколько десятилетий. Всевозможные биологические процессы зависят от белков, а каждый белок состоит из последовательности аминокислот. То, как эти молекулы складываются в трёхмерную форму, определяет функцию белка, и картирование этих структур может помочь учёным разработать новые вакцины, уничтожить бактерии, устойчивые к антибиотикам, и найти новые методы лечения рака. Без трёхмерной формы белка у учёных есть не более чем кучка кирпичиков Lego без инструкции по их сборке.

Раньше на определение структуры одного белка по последовательности аминокислот уходили годы. Но в 2022 году флагманская научная модель DeepMind, AlphaFold, нашла наиболее вероятную структуру почти всех известных науке белков — около 200 миллионов. Подобно шахматным программам и программам для игры в го, которые ищут наилучший возможный ход, AlphaFold перебирает множество возможных структур для последовательности аминокислот, чтобы найти наиболее вероятную. Программа сокращает до нескольких секунд работу, которая потянула бы на целую докторскую диссертацию, и её широко хвалят за «революционное влияние» как на фундаментальную биологию, так и на разработку новых методов лечения. Тем не менее независимые исследователи отмечают, что, несмотря на нечеловеческую скорость, модель не полностью объясняет, почему та или иная структура является вероятной. В результате учёные пытаются расшифровать предсказания AlphaFold, и Хассабис отметил, что эти усилия приносят хорошие результаты.

По словам Хассабиса, ИИ позволяет исследователям изучать сложные системы в «мире битов» гораздо быстрее, чем в «мире атомов», а затем физически проверять свои гипотезы уже на последнем шаге. Эта технология продвигает прогресс во многих других дисциплинах, не только повышая скорость и масштабы, но и меняя представления о том, какие исследования возможны. Например, неврологи из Мета1 и других университетов превращают искусственные нейронные сети, обученные «видеть» фотографии или «читать» текст, в гипотезы о том, как мозг обрабатывает изображения и язык. Биологи используют искусственный интеллект, обученный на генетических данных, для изучения редких заболеваний, совершенствования иммунотерапии и лучшего понимания проблемных вариантов атипичной пневмонии (SARS-CoV-2). «Теперь у нас есть жизнеспособные гипотезы, а раньше были загадки», — сказал мне Джим ДиКарло, нейробиолог из Массачусетского технологического института, который стал пионером в использовании ИИ для изучения зрения в мозге.

Астрономы и физики используют машинное обучение для обработки массивов данных из Вселенной, которые раньше были слишком огромны, чтобы к ним прикоснуться, рассказал мне Брис Менар, астрофизик из Университета Джона Хопкинса. Некоторые эксперименты, такие как коллайдер частиц CERN, производят слишком много информации, чтобы её можно было физически хранить. Исследователи полагаются на искусственный интеллект, который отбрасывает знакомые наблюдения, сохраняя неизвестные для анализа. «Мы не знаем, как выглядит иголка, потому что это необнаруженные физические явления, но мы знаем, как выглядит стог сена, — сказал мне Александр Салай, директор Института интенсивной обработки данных при Университете Джонса Хопкинса. — Поэтому компьютеры обучены распознавать сено и, по сути, отбрасывать его».

По словам Зитника, в долгосрочной перспективе можно даже объединить модели ИИ и физические эксперименты в своего рода «самодвижущуюся лабораторию», где компьютерные программы и роботы будут генерировать гипотезы, планировать эксперименты для их проверки и анализировать результаты. До создания таких лабораторий ещё далеко, хотя прототипы уже существуют, например, роботизированная система Scientific Autonomous Reasoning Agent, которая уже обнаружила новые материалы для возобновляемых источников энергии. SARA использует лазер для итерационного анализа и изменения материалов, причём каждый цикл длится несколько секунд, рассказала мне Карла Гомес, специалист по информатике из Корнелла, что позволяет сократить время исследований с нескольких дней до нескольких часов. Если такое будущее наступит, то программное обеспечение и роботы превратятся из инструментов в коллабораторов и даже соавторов знаний.


Данных в квантовых экспериментах слишком много, чтобы их мог хранить человек, эксперименты слишком быстры, чтобы их мог проводить человек, нейронаучные гипотезы слишком сложны, чтобы их мог вывести человек — даже когда искусственный интеллект позволяет выполнять научную работу, которая раньше казалась невозможной, эти же инструменты создают эпистемическую дилемму. Они будут производить революционные знания, одновременно разрушая понятия собственно знания.

«Святой Грааль науки — это понимание, — говорит Зитник. — Чтобы понять явление, будь то поведение клетки или планетарной системы, нужно уметь определять причины и следствия». Но модели ИИ, как известно, непрозрачны. Они выявляют закономерности на основе гигантских массивов данных с помощью программных архитектур, внутреннее устройство которых не поддаётся человеческой интуиции и рассуждениям. Эксперты стали называть их «чёрными ящиками».

Это создаёт очевидные проблемы для научного метода. «Мы должны понять, что происходит внутри этого чёрного ящика, чтобы понять, откуда взялось это открытие», — сказал мне Салай. Предсказание события без понимания, почему эти предсказания точны, может переместить нас в сторону науки другого типа, в которой знания и вытекающие из них действия не всегда сопровождаются объяснением. Модель ИИ может предсказать наступление грозы, но не объяснить физику и атмосферные изменения, которые её вызвали, проанализировать рентгеновский снимок, не показав, как она пришла к своему диагнозу, или предложить абстрактные математические гипотезы, не доказав их. Подобные переходы от наблюдений и обоснованных рассуждений к математическим вероятностям случались в науке и раньше: уравнения квантовой механики, появившиеся в XX веке, точно предсказывают субатомные явления, которые физики до сих пор не до конца понимают, что заставило самого Альберта Эйнштейна усомниться в квантовой теории.

Сама наука может предложить решение этой головоломки. За последнее столетие физические эксперименты многое открыли о квантовом мире, и точно так же инструменты ИИ могут казаться непостижимыми отчасти потому, что исследователи не потратили достаточно времени на их изучение. «Сначала нужно создать артефакт, прежде чем разбирать его на части и анализировать с научной точки зрения», — сказал мне Хассабис, а учёные только недавно начали создавать модели ИИ, достойные изучения. Даже старые численные симуляции, хотя и гораздо менее сложные, чем современные модели ИИ, трудно интерпретировать интуитивно, но тем не менее они десятилетиями служили основой для новых открытий.

Если исследователи поймут, как искусственные нейроны реагируют на изображение, они смогут перенести эти предсказания на биологические нейроны; если исследователи поймут, какие части модели ИИ связывают мутацию с болезнью, учёные смогут получить новые знания о геноме человека. Такие модели представляют собой «полностью наблюдаемые системы. Вы можете измерить все части», — говорит ДиКарло. В то время как он не может измерить каждый нейрон и синапс в мозге обезьяны во время операции, он может сделать это для модели ИИ. При правильном доступе программы ИИ могут предоставлять учёным не столько «чёрные ящики», сколько новый тип объектов, требующих нового типа исследований — не столько «модели» естественного мира, сколько дополнения к нему. Некоторые учёные даже надеются создать «цифровых двойников» для моделирования клеток, органов и планеты.


Однако ИИ это не панацея. AlphaFold может быть революционным, и, возможно, Insilico действительно радикально сократит время, необходимое для разработки новых лекарств. Но у этой технологии есть существенные ограничения. Например, модели ИИ должны обучаться на большом количестве релевантных данных. AlphaFold — это «впечатляющий успех», — сказала мне Дженнифер Листгартен, специалист по вычислительной биологии и компьютерным наукам из Калифорнийского университета в Беркли, — но он также «опирался на очень дорогие, тщательно контролируемые данные, которые генерировались десятилетиями в лаборатории по очень чётко определённой проблеме, которую можно было оценить очень чисто». Отсутствие высококачественных данных в других дисциплинах может помешать использованию ИИ или ограничить его.

Даже при наличии таких данных реальный мир может быть более сложным и динамичным, чем кремниевая симуляция. Например, преобразование статичной структуры молекулы в её взаимодействие с различными системами организма — это проблема, над которой исследователи всё ещё работают, сказал мне Андреас Бендер, изучающий молекулярную информатику в Кембриджском университете. ИИ может быстро предлагать новые лекарства, но «вам всё равно нужно будет запустить процесс поиска лекарств, который, конечно, довольно длительный», — сказал мне Джон Джампер, исследователь из DeepMind, возглавлявший разработку AlphaFold.

Клинические испытания длятся годами, и многие из них оказываются безуспешными; многие стартапы и инициативы по созданию лекарств на основе ИИ были свёрнуты. Эти неудачи в некотором смысле являются доказательством того, что наука работает. Результаты экспериментов, наряду с известными физическими законами, позволяют учёным предотвратить галлюцинации своих моделей, сказала мне Анима Анандкумар, специалист по информатике из Калифорнийского технологического института. Аналогичных законов лингвистической точности для чат-ботов не существует — потребители вынуждены доверять Big Tech.

В лаборатории новые предсказания можно физически и безопасно проверить в изолированных условиях. Но при разработке лекарств или лечении пациентов ставки гораздо выше. Существующие карты генома человека, например, ориентированы на белых европейцев, но проявление многих заболеваний, таких как диабет, существенно зависит от расы и этнической принадлежности. Как предвзятые наборы данных порождают расистские чат-боты, так и перекосы в биологических данных могут означать, что «модели неприменимы к людям неевропейского происхождения», — сказал мне Бендер, или к людям другого возраста, или с существующими заболеваниями, или принимающим сопутствующие лекарства. Программа диагностики рака или лечения, разработанная ИИ, может быть особенно эффективной только для небольшой части населения.

Модели ИИ могут изменить не только то, как мы понимаем мир, но и то, как мы понимаем само понимание. Если это так, то мы должны создать новые модели знания — чему мы можем доверять, почему и когда. В противном случае наше доверие к чат-боту, инструменту для поиска лекарств или прогнозу урагана с помощью ИИ может выйти за рамки науки. Это может быть больше похоже на веру.


1 Решением Тверского районного суда города Москвы от 21 марта 2022 года американская транснациональная холдинговая компания Meta Platforms Inc. (1) признана осуществляющей экстремистскую деятельность. На территории России запрещены работа Meta и реализация её продуктов: социальных сетей Facebook (2) и Instagram (3).

Комментарии (21)


  1. OlegZH
    20.12.2023 19:53

    Всё это говорит о том, что здесь ещё пока мало науки.

    Модели ИИ могут изменить не только то, как мы понимаем мир, но и то, как мы понимаем само понимание. Если это так, то мы должны создать новые модели знания - чему мы можем доверять, почему и когда.

    Для того, чтобы что-то изменить, надо, чтобы было то, что подлежало бы изменению. А пока человечество само ходит в потёмках. А значит, нет и первичных моделей знания. Не от чего отталкиваться. Сначала нужно найти точку опоры, а уже потом — переворачивать мир.


  1. Olegsoft
    20.12.2023 19:53

    Да вот тоже недавно задумывался. Если GPT 5 умнее среднего человека допустим в 1000 раз. Так ей просто можно задавать любые неразрешимые задачи человечества и она таки их решит. Из всех областей знаний ! И в микро мире, и в звёздной физике чёрных дыр, и в медицине. Да во всём. Поначалу меня очень впечатлили разговоры с Gpt о медицинском бессмертии!!! Такое впечатление что либо она искустно врёт, либо действительно нащупала интуитивно в общей базе знаний некоторое аспекты медицинского бессмертия человека. Ставки слишком высоки, поэтому этой теме нужно посвящать и заниматься целым научным институтам. Хотя зачем они ? Есть же gpt ))


    1. N-Cube
      20.12.2023 19:53

      Над неразрешимыми загадками «средний» человек (тут вспоминается «это дубли у нас простые» от Стругацких) вовсе не думает, так что превосходство мнимое. А те кто думает, или мечтатели (как Циолковский) или специалисты в своей области знаний (как Эйнштейн), и тут пока нейросети вообще бесполезны - не имеют они желаний и не умеют желание «хочу к звездам» превратить в теорию ракетного движения.


  1. michael108
    20.12.2023 19:53

    Интересно, а сможет ли ИИ изобрести интегральное исчисление, придумать периодическую систему или структуру бензольнго кольца, основываясь на данных, доступных на момент появления этих моделей?

    Это я к тому, что, с моей точки зрения, современный ИИ -- это, по сути, супербиблиотека, которая может произвольно комбинировать ИЗВЕСТНЫЕ знания , и "вытаскивать" из них скрытую информацию. Т.е. то, что, по сути, УЖЕ известно, но не сформулировано в явном виде. Например, если прочитать кучу статей по разным наукам, то можно будет заметить взаимосвязи, которые в явном виде ни в одной статье не сформулированы. Например, в одной статье говорится о влиянии витамина на определенный орган, в другой -- что активность этого органа связанв с выделением определенного гормона, а в третьей -- что этот гормон связан с изменениями в психике при определенных болезнях. Таким образом, мы сможем получить "новое знание" о том, что эти изменения в психике можно попытаться откорректировать, прописывая определенный витамин.

    Правда, для такой работы лучше бы подошла система онтологии,а не чатбот, т.к. она была бы прямо заточена на решение подобных задач. Но построить хорошую онтологию -- сложно, чат-бот в этом с\мысле попроще будет. И я все равно не уверен, что даже такая система будет способна придумать бензольное кольцо "с нуля"...


    1. N-Cube
      20.12.2023 19:53

      Онтологии много пытались строить, но все упирается в отсутствие структурированности данных. Те же биомедицинские базы данных, по которым лекарства вычислительно синтезируют, создавались людьми, прочитывающими сотни тысяч научных публикаций (в Индии сотни работников этим заняты на фуллтайм) и стоили огромных денег при всей субъективности и уйме ошибок. А теперь АльфаФолд создал намного более полную, аккуратную и бесплатную базу знаний https://alphafold.ebi.ac.uk, так что можно и дома лекарства создавать (там в основе алгоритм Дейкстры для поиска сигнальных путей).


      1. arteys
        20.12.2023 19:53

        Альфафолд всего лишь предсказывает структуру белка и делает это сколько-то хорошо (с кучей проблем) только для белков похожих на тех на которых он учился.

        И вообще абсолютно не понятно как вы связали разработку лекарств и Альфафолд. Не, они связаны, но пожалуйста расскажите как вы планируете использовать это?

        Вообще вот я учёный (физика, биология) и пока не заметил какого-то существенного влияния ИИ на мою работу. Ну вот появилось несколько инструментов которые упрощают работу с литературой, но не более того


        1. N-Cube
          20.12.2023 19:53

          Model Confidence у них большей частью отличный, а насчет наличия ошибок как таковых, так в публикуемых статьях все намного хуже, если из них данные как основу брать. Как использовать - к примеру, можно визуализировать, к чему и как крепится вирус ковида, модель которого давно опубликована, соответственно, и противодействие найти (ловушки). А без этого что вообще можно делать с геномом человека в виде нескольких гигабайт последовательностей нуклеотидов и без понимания их структуры и функций (зависящих от структуры)? Только лабораторные опыты ставить.


          1. arteys
            20.12.2023 19:53

            Этим занимались с самого начала ковида. Хотя вообщем-то молекулярному докингу намного больше лет. И как, много лекарств сделали?

            А с геномом вообщем-то биоинформатики уйму всяких штук делают и с ИИ и без него.


            1. N-Cube
              20.12.2023 19:53

              Гомункулусов вообще тысячи лет делать пытаются, куда там несколько лет. Правда, безуспешно. А от ковида вакцины сделали и довольно оперативно.


    1. Wizard_of_light
      20.12.2023 19:53

      сможет ли ИИ изобрести интегральное исчисление, придумать периодическую систему или структуру бензольнго кольца

      Как я понимаю, про картину и симфонию вопрос снят :)

      супербиблиотека, которая может произвольно комбинировать ИЗВЕСТНЫЕ знания , и "вытаскивать" из них скрытую информацию. Т.е. то, что, по сути, УЖЕ известно, но не сформулировано в явном виде.

      Это не так бесполезно как кажется. Вся математика, например, - поиск следствий конечного набора аксиом.


      1. Aak6
        20.12.2023 19:53

        Не конечного. Даже в арифметике, по Теореме Гёделя, бесконечное количество утверждений, которые ни доказать ни опровергнуть в аксиоматике Пеано. То есть они в свою очередь могут быть новыми аксиомами. Их бесконечное число.


        1. N-Cube
          20.12.2023 19:53

          Причем тут количество всех возможных утверждений? Математика оперирует вполне конкретными аксиомами, а не набором всех возможных.


          1. Aak6
            20.12.2023 19:53

            Там было написано "Вся математика". Так вот, то что выводится из конечного числа аксиом, за конечное число шагов - это мизерная часть всей математики, если под математикой понимать все непротиворечивые утверждения конечной длины, написанные на соответствующем формальном языке. Или вы думаете, что Гёдель вышел за рамки математики, доказывая свои теоремы.


            1. N-Cube
              20.12.2023 19:53

              Удачи вам почитать «всю литературу», составленную из всех комбинаций всех существующих символов.


              1. Aak6
                20.12.2023 19:53

                Никаких ни всех! Во-первых, утверждения составляются строго по правилам языка, то есть 2=+=5 не есть формула. Во-вторых утверждение должно "иметь смысл" - непротиворечивую, недоказуемую формулу в арифметике не так уж и просто написать.


      1. DarthVictor
        20.12.2023 19:53

        Как я понимаю, про картину и симфонию вопрос снят :)

        Насколько я знаю никаких симфоний или картин "ИИ" пока не создал. Максимум были случаи, когда картину или симфонию делали люди с помощью ИИ. Не стоит думать, что у этих людей не было художественного вкуса. И совершенно не факт, что например симфонию нельзя было бы раньше сгенерировать при помощи более стандартного алгоритма. А сейчас появились из-за хайпа вокруг ГСС. И это не значит, что здесь нет достижения ГСС. Напротив, они явно создают новый рынок инструментов для творчества, с этим странно было бы спорить.

        Это не так бесполезно как кажется.

        Это совершенно не бесполезно в тех случаях, когда в это упирались ранее. Даже если не знали, что в это упирались ранее.

        Вся математика, например, - поиск следствий конечного набора аксиом.

        В значительной мере математика - это именно выдумывание новых аксиом и областей знаний, в некоторых случаях удаление или замена старых.


  1. AnatolyEmelin
    20.12.2023 19:53

    ИИ в данном контексте работает как фильтр , сужая для исследователя количество вариантов в выборке. По сути это просто инструмент, применение которого есть ответственность исследователя. Однако зачем автор применил такой «жареный» заголовок «…но какой ценой…» мне не понятно, что он имел ввиду. Исследователи получили ещё один инструмент для работы. Этот инструмент будет или эффективным или нет. Вопрос веры в результат от применения этого инструмента - это врос квалификации исследователя. Любой результат исследований не принимается «на веру», а если вдруг начнёт приниматься, то это вопрос не к ИИ а к принимающим.


  1. Aak6
    20.12.2023 19:53

    Что там фолдинг белка. Вот есть намного более простая по формулировке задача. Дано число, скажем 1000 цифр или меньше, определить является ли оно произведением двух простых чисел или нет, и найти эти простые числа за разумное время если является. Огромная база данных для обучения - генерируй такие числа и учись не хочу. Но не справился ИИ с такой задачей.


    1. Aak6
      20.12.2023 19:53

      Хотя это не гипотеза Римана, а обычная конечная задача, даже если 1000 заменить на 10000, и, кажется. ничего особенного для мощного ИИ. Но посмотрим, может и найдёт алгоритм. Правда тогда системы шифрования придётся менять.


  1. sprayer
    20.12.2023 19:53

    Толку от этого мало, и не лекарства делает а деньги, то есть пытаются на халяву сделать средство для продаж без больших вложений. И даже в статье указано что не факт лекарства будут не пустышками. Человек в любом случае преследует прибыли, так что в этом нет ничего радужного. А в Америке частные фирмы как акулы, могут ещё выкупить права и ломить цены, как были случаи с лекарством от малерии, но помогающий от токсоплазмоза, и ценники резко взлетели в десятки раз, а дженерики запретили по всему миру.


  1. Player17
    20.12.2023 19:53

    Ящик "черный" потому что он не ведёт журнал. Таким мышлением обладают дети и аути, те. они не знают как у них получается верный ответ. Вычисления настолько быстрые, система не отслеживает их, это отнимало бы время.