Привет, Хабр! Сегодня я покажу тебе свой перевод одного замечательного интервью с Александром Жаворонковым. Надеюсь тебе будет так же интересно читать, как и мне переводить.
Искусственный интеллект обещает нам лучшее здоровье, более быструю разработку и тестирование лекарств. Все это делается с целью улучшения результатов лечения пациентов. Сегодня мы говорим с мировым экспертом по использованию искусственного интеллекта в науках о жизни, цель которого находить и разрабатывать лекарства быстрее и дешевле.
Александр Жаворонков является основателем и генеральным директором Insilico Medicine. Компания является лидером в области искусственного интеллекта следующего поколения, методы которого направлены на открытие новых лекарств, разработку биомаркеров и исследования старения. До Инсилико он работал на руководящих должностях в ATI Technologies, NeuroG Neuroinformatics, Фонде биогеронтологических исследований и YLabs.AI. С 2012 года он опубликовал более 130 рецензируемых научных статей и 2 книги. В течение шести лет он организовывал ежегодные форумы «Исследования старения для обнаружения лекарств и искусственный интеллект для здравоохранения» в Basel Life / EMBO в Базеле. Александр — адъюнкт-профессор Института Бака по исследованиям старения.
Майкл Кригсман: Расскажите вкратце об Insilico Medicine, а также о том, над чем вы работаете.
Александр Жаворонков: Мы сосредоточены в первую очередь на применении методов искусственного интеллекта следующего поколения для разработки лекарств, разработки биомаркеров, а также исследований старения. Мы ориентируемся конкретно на две техники машинного обучения: генеративно-состязательные сети (GAN) и обучение с подкреплением. Это методы, в которых мы наиболее опытны в своей области.
Мы используем эти методы для двух целей. Одна из них — выявление биологических мишеней и создание биомаркеров из нескольких типов данных, а также создание новых молекул, новых молекулярных структур с определенным набором свойств. Мы были одной из первых компаний, возможно, первой, которая создала новые молекулы, используя новую технологию, называемую генеративно-состязательными сетями, и проверила эти молекулы экспериментально.
Майкл Кригсман: Дайте нам некоторый контекст. Что такое pipeline разработки лекарств? Почему это так сложно? Давайте поговорим об этом. Затем мы можем перейти к тому, как ИИ делает это лучше, легче.
Александр Жаворонков: Открытие и разработка лекарств — это очень длительный процесс. Это также один из тех процессов, где у вас больше неудач, чем успехов. На самом деле неудач гораздо больше, чем успехов.
Требуется более 2,6 миллиарда долларов на разработку лекарства и его вывод на рынок для лечения определенного заболевания. Это после того, как молекула была проверена на животных. Кроме того, после того, как молекула была протестирована на животных, уровень отказов составляет 92%. Когда лекарство тестируется на людях, то оно терпит неудачу в 92% случаях. Итак, процесс не только длительный, но и рискованный.
Обычно время, необходимое для открытия и развития молекулы, составляет около десяти лет. Люди, которые инициируют процесс, не всегда присутствуют, когда молекула внедряется. Процесс состоит из нескольких этапов.
Первый — генерация гипотез. Вы выдвигаете гипотезу, теорию определенной болезни и определяете соответствующие мишени. Вы говорите о том, какие белки вовлечены в заболевание и какие белки являются причиной.
После этого вы идете и разрабатываете антитело или небольшую молекулу для этого белка-мишени. Если вы разрабатываете небольшую молекулу, вы обычно начинаете с проверки больших библиотек соединений, которые могут поразить эту конкретную мишень, и проводите всевозможные эксперименты, чтобы увидеть, насколько хорошо эти маленькие молекулы связываются с этой мишенью.
После этого вы выбираете несколько вариантов. Вы определяете, какие молекулы лучше всего подходят для этой белковой мишени, и начинаете проводить всевозможные эксперименты на этих молекулах, чтобы определить, хорошо ли они работают в биологической системе, в анализе, связанном с заболеванием, у мыши, у собаки или других животных, а затем вы подаете заявку на IND (исследование нового лекарства) с FDA, чтобы получить молекулу в клинических испытаниях.
После того, как этот процесс завершен, мы приступаем к разработке лекарств и начинаем клинические испытания. Все начинается с фазы I, которая связана с безопасностью. На фазе II вы проверяете лекарство на эффективность. На фазе III вы тестируете обе фазы в больших клинических условиях, на больших популяциях. После вы можете перейти к фазе IV или начать выпуск продукта.
Александр Жаворонков: А потом постмаркетинговое исследование. Этот процесс обычно занимает более десяти лет и терпит неудачу в 92% случаев.
С ИИ вы действительно можете играть практически во всех сегментах, начиная с открытия лекарств на ранней стадии, когда ИИ может помочь вам с моделью гипотезы и, по сути, вытащить иголки из стога сена с идентификатором мишени, с идентификацией малых молекул, с виртуальным скринингом, с созданием новых молекул с особыми свойствами, с планированием дизайна клинического испытания и включением в клиническое испытание. И затем, также, для прогнозирования результатов клинических испытаний.
Майкл Кригсман: Где ИИ начинает сокращать процесс, делать его лучше?
Александр Жаворонков: Если вы находитесь на ранних этапах разработки лекарства, начали работать над генерацией гипотез и идентификацией мишеней, обычно у вас есть несколько путей, по которым нужно следовать. Одним из способов является поиск литературы и выявление перспективных областей, которые были открыты учеными в прошлом и опубликованы.
ИИ может помочь вам добывать огромное количество литературы, а также другие связанные источники, чтобы определить сигналы и мишени, которые могут быть связаны с болезнью. Мы, в Insilico, обычно начинаем с данных по грантам. Мы смотрим на биомедицинские гранты на сумму около 1,7 трлн долларов за последние 25 лет. Затем мы смотрим, как эти гранты превращаются в публикации, в патенты клинических испытаний, а затем в продукты на рынке.
Мы следуем от идее к идее и от денег к деньгам, то есть от денег на рынке. Мы также смотрим, как деньги становятся данными. Так, обычно, когда правительство поддерживает определенное исследование, данные должны храниться в публичном хранилище, чтобы другие люди могли их копировать, а также для общего блага.
Мы стараемся следить за деньгами в данных. Если данных нет, мы пытаемся связаться с ученым и получить данные от ученого и / или призвать ученого поместить данные в общедоступное хранилище.
Мы начинаем с текстовых баз данных, но также связываем эти данные с омиксными данными. По сути, все, что заканчивается на «омика» ( транскриптомика, геномика, метаболомика, метагеномика), называется омиксными данными.
Мы работаем в основном с данными по экспрессии генов, поэтому мы смотрим, как уровень экспрессии определенных генов или целых сетей меняется, скажем, с здорового состояния на болезнь. Мы преобразуем эти изменения, эти признаки болезни в отдельные мишени, и определяем какие виды белков могут быть нацелены с помощью небольшой молекулы.
Затем мы вернемся к prior art в тексте и посмотрим, опубликовал ли кто-нибудь что-нибудь, что укрепило бы нашу гипотезу. Это не обязательно означает, что наша гипотеза неверна, если в тексте нет сигнала, потому что иногда люди просто не могли реально связать определенную мишень с болезнью, используя более старые методы, но это дает нам немного больше уверенности, чтобы увидеть что кто-то уже затронул эту проблему и эту мишень раньше.
Мы собираем огромные объемы данных, которые просто невозможно обработать с помощью человеческого интеллекта. Мы также собираем и объединяем эти типы данных. Иногда эти типы данных полностью несовместимы, и невозможно просто зашить их вместе с помощью стандартных инструментов. Вам действительно необходимо обучать глубокие нейронные сети одновременно нескольким пакетам данных, чтобы они могли обобщаться и чтобы мы могли извлекать соответствующие функции, присутствующие в нескольких типах данных одновременно.
Некоторые типы данных, с которыми мы работаем, совершенно непостижимы для человеческого разума. Как, например, данные генной экспрессии или данные движения, или данные сканирования сердечно-сосудистой деятельности, или ультразвуковые данные. Нам удается объединить эти типы данных с помощью ИИ, а затем определить соответствующие мишени.
Майкл Кригсман: В Insilico ваша основная специализация — биология и медицина или разработка методов искусственного интеллекта? Можно ли разделить эти два направления?
Алекс Жаворонков: В нашем случае оба направления хороши, и мы нанимаем людей на конкурсной основе, на международном уровне. На конкурсах мы проводим очень сложные тесты, которые люди должны очень быстро решить. Эти проблемы обычно связаны с разработкой метода ИИ и решением сложной биологической или химической проблемы.
Однако, когда вы смотрите на действительно великих ученых из ИИ, они, как правило, не очень хороши в биологии или в химии. Они хороши в математике. Вот почему некоторый процент нашей компании — просто замечательные математики, которые разрабатывают новые методы, например, для соединения химии и биологии с использованием глубокого обучения.
Часть компании специализируется на применении уже существующих методов, таких как GAN, и усилении обучения к существующим проблемам в химии и биологии. Эти люди обычно на прикладной стороне, и они знают и химию и биологию. Они могут общаться с математиками, а также проводить некоторые фундаментальные исследования в области ИИ.
Конечно, у нас просто есть чистые биологи и химики, которые также необходимы для проверки некоторых результатов нашего ИИ. Вот почему у нас такая большая, разнообразная и международная команда, потому что нам действительно нужно охватить эти три области: методы, приложения и валидацию.
Майкл Кригсман: У нас есть интересный вопрос от Криса Петерсона в Твиттере, который говорит: «Параллельные программы на Фортране, основанные на гриде, все еще используются для некоторых фармакокинетических и фармакодинамических исследований. Видите ли вы, что ИИ заменяет олдскульный код, усиливает его или развивается параллельно?»
Александр Жаворонков: Думаю, сейчас нам нужно продвигаться параллельно. Конечно, некоторые из старых методов до сих пор используются действительно ведущими экспертами в области открытия лекарств. Но большинство этих методов значительно ускоряются с помощью высокопроизводительных вычислений и искусственного интеллекта, так что это типичное программное обеспечение, которое существует уже очень давно, например, Schrodinger. Компания существует с 92 года.
Компания сделала большой прорыв во многих областях, и им удалось продвинуть старые алгоритмы для решения очень сложных задач. Я думаю, что в Insilico мы пытаемся все заново изобрести и пишем собственное программное обеспечение. Но, конечно, мы знаем многих наших сотрудников, которые просто хотели бы взять маленькие кусочки нашего большого салями, которое мы разрабатываем, и поиграть с ним. Возможно, они используют более классические инструменты, которые мы не можем обойти сейчас.
В идеале необходимо иметь цельный конвейер, который идентифицирует мишени, генерирует молекулы и проводит эти молекулы через большое количество симуляций в одном бесшовном конвейере. Это то, что мы строим, и это наш Святой Грааль. Но, конечно, многие компании, многие группы пытаются сделать игру Lego и пытаются использовать несколько инструментов с разными выходами для решения одной и той же проблемы.
Майкл Кригсман: Почему вы разрабатываете свои собственные инструменты?
Александр Жаворонков: Да просто потому, что многие из используемых нами методов настолько новы, что несовместимы с более старыми инструментами. Есть много групп, которые утверждают, что занимаются искусственным интеллектом, но, по сути, они занимаются механической работой, беря готовое программное обеспечение и пытаясь преодолеть некоторые пробелы в фармакологических исследованиях и разработках, используя эти инструменты. Мы этого не делаем. Мы разрабатываем все с нуля, от идентификатора мишени до генерации малых молекул.
Майкл Кригсман: Теперь мы говорили об использовании ваших методов для выявления потенциальных кандидатов. Следующим шагом является оценка. Во-первых, мы должны раскрыть возможности, а вы делаете это путем агрегирования всех этих данных и последующего их анализа с использованием различных методов. Допустим вы сделали это. Как вы оцениваете кандидатов, которых вы раскрыли изначально?
Александр Жаворонков: Обычно, когда у вас остается список белков-мишеней для конкретного заболевания и вы пытаетесь расставить приоритеты, вы пытаетесь аннотировать эти белки с максимально возможным количеством баллов. Вы смотрите, была ли эта белок-мишень когда-либо вовлечена в токсичность. Как это связано со всем остальным? В какой ткани он играет большую роль? Как белок взаимодействует с другими белками? Это лекарство? Это лекарственное средство с маленькой молекулой или с антителом? Кто-нибудь еще это использовал? Какое патентное пространство вокруг молекулы? Кто-нибудь пробовал взять его в клинику с маленькой молекулой или антителом для определенного заболевания?
Есть много, много, много, много функций оценки, которые вы должны рассмотреть. В конце, когда у вас в основном остается очень маленький набор мишеней, вы также тестируете их в различных биологических системах, чтобы определить, какая из них более подходит для интересующей вас болезни.
Я приведу пример из практики. Например, нас очень интересует фиброз. Фиброз не очень простой процесс для описания, и существует несколько типов фиброза. Существует IPF, или легочный фиброз. В легких наблюдается индуцированный курением фиброз, кроме этого наблюдается старческий фиброз. Мы идентифицировали более 120 типов фиброза, сравнивая нормальную ткань с фбирозной тканью, связанной с определенным состоянием.
Мы только недавно провели тематическое исследование, в котором мы рассмотрели IPF, определили список мишеней для этого состояния, и в нашем списке было 50 мишеней. Мы смотрели на то, когда эти мишени более активны и более актуальны для заболевания, на какой стадии заболевания, потому что, я думаю, если вы поймете это позже или решите эти вопросы позже, вы будете лечить симптомы, а не причину.
В нашем случае мы определяем большой список мишеней, которые, вероятно, будут очень актуальны на ранней стадии прогрессирования заболевания. Затем мы смотрим на то, какие мишени являются новыми, на какие мишени люди не обращали внимания. Мы не хотим сосредотачиваться на старых мишенях. Затем мы смотрим на то, какие мишени пригодны для лекарств, где мы могли бы на самом деле найти небольшую молекулу из библиотеки или можем создать молекулу с нуля. Затем мы рассматриваем, какие мишени могут быть проверены в конкретном наборе анализов на фиброз.
Майкл Кригсман: Где есть влияние технологий искусственного интеллекта, которые вы используете в этом процессе?
Александр Жаворонков: Обычно для подсчета баллов оценки результата. Вы распределяете несколько баллов для мишеней. В нашем случае мишень имеет более 50 баллов. Мы определяем, была ли она вовлечена в определенное состояние раньше, взаимодействует ли она с другими белками определенным образом, может ли это привести к токсичности. Те предикторы, которые в основном дают вам такую ??оценку и вероятность того, что эта мишень является наиболее релевантной, глубоко изучают и разрабатывают различные организации. Мы разработали свои предикторы с помощью машинного обучения.
Майкл Кригсман: У нас есть еще один интересный вопрос из Твиттера от Шреи Амин. Она пишет: «Как тип исследования, которое вы описывали, и процессы различаются среди научными кругов и промышленности?»
Александр Жаворонков: Это очень, очень хороший вопрос. В промышленности, в большой фармацевтике, люди немного менее предприимчивы. Они пытаются разработать различные методы, чтобы действительно решить проблему и внести постепенные изменения. Их методы не нацелены на публикацию в научном журнале.
В научных кругах люди гораздо более изобретательны и предприимчивы. Они пытаются опубликовать результаты. Вот откуда инновации, в первую очередь.
Мы, в Insilico, находимся между наукой и промышленностью, поэтому мы публикуем около двух научных работ в месяц. Это даже для некоторых академических групп достаточно, чтобы также доказать концепцию и объяснить куда мы идем.
Академики, я думаю, в наши дни гораздо продуктивнее, будь то разработка новых методов и показ новых направлений. Тем не менее, разрыв между действительно хорошими учеными-компьютерщиками, которые разрабатывают новые методы, которые могут иметь отношение к открытию лекарств, очень часто настолько далеки от биологии и химии. Они выпускают статьи действительно хорошие с точки зрения машинного обучения, но результаты очень далеки от реальных приложений. Очень часто они на самом деле не понимают, что они где-то переоснащены или, если это совершенно не относящийся к делу результат, который они получают или получают, только после того, как кто-то попробует это в биологии и химии.
Очень часто, и в настоящее время такое на самом деле более распространено, многие люди помещают статьи в Архив с броским заголовком так, что они становятся вирусными и выбираются браузерами, Google или некоторыми новостными агентствами. Они получают признание и пиар за эту работу, но затем вы пытаетесь повторить то, что они сделали, или даже просто внимательно прочитаете статью, и вы понимаете, что в реальном мире это не сработает. Я думаю, что такого рода статьи и такие виды усилий, ранние результаты, особенно со стороны академических групп, не проходя экспертную оценку, также внесли большой скептицизм в большую фармацию. Люди просто не думают, что многие методы актуальны, применимы или трансформируют их бизнес.
Майкл Кригсман: Давайте поговорим об аспекте построения команды, потому что одна из вещей, которые вы упомянули пару раз, — это важность как возможностей машинного обучения, так и возможностей биологии. Это очень специализированные навыки, и как вы создаете команды, которые позволяют обеим сторонам работать вместе и создавать то, что одна или другая не могут сделать в одиночку?
Алексндр Жаворонков: Это еще один очень хороший вопрос. В нашем случае это одна из причин, почему мы так медленно растем. Мы работаем уже 5 лет, но нас все еще 66 человек. Одна из причин этого медленного, органического роста состоит в том, что требуется время, чтобы действительно объединить ученых ИИ с биологами и химиками. Очень трудно найти людей, которые хороши в обоих случаях одновременно. Обычно вы хорошо разбираетесь в математике или в химии, или вам действительно нужно иметь хорошие навыки программирования, чтобы иметь возможность создавать API и правильно комбинировать вашу технологию с чьей-либо другой.
Мы стараемся работать в группах из трех или четырех человек над конкретными терапевтическими проектами, в которых один человек хорошо разбирается в химии или биологии, один человек хорош в искусственном интеллекте, а другой — просто в базовых ИТ. В основном это команды из трех или четырех человек. Помимо них, существует инфраструктура, организационная инфраструктура, которая помогает управлять этими командами. Мы также отделили команду искусственного интеллекта от всех остальных, чтобы они могли работать над методами, не попадая в прикладную область.
Получить такого рода таланты, которые действительно хотят внести свой вклад в разработку методов и разработать новые алгоритмы, это очень и очень сложно. Получить людей, которые хороши в применении уже разработанных методов, это довольно просто. Заставить двоих работать вместе, это очень сложно. Чтобы сделать это, мы, опять же, пытаемся добиться органического роста и работаем над проектами в небольших командах.
Майкл Кригсман: На ??самом деле, у нас есть вопрос из Твиттера на тему вашей бизнес-модели. Крис Петерсон задает замечательные вопросы. Большое спасибо, Крис. Он спрашивает: «Вы заключили договор на поиск конкретной терапии или вы разрабатываете молекулы с нуля и надеетесь лицензировать их для клинических испытаний путем распространения?»
Александр Жаворонков: Мы работаем в течение пяти лет, и мы изучили несколько бизнес-моделей. Как компании, занимающейся искусственным интеллектом, вы должны исследовать ее, потому что в противном случае ее очень и очень трудно масштабировать на одной бизнес-модели, и это также довольно рискованно.
Мы начинали как сервисная компания, и мы начали сотрудничать с фармацевтическими компаниями, с биотехнологическими компаниями, а также с венчурными фондами, где мы предоставляли услуги или предоставляли им систему. Мы изучили приложения, которые ищут люди, и начали разрабатывать наши собственные маленькие молекулы, открывать их и затем лицензировать.
Наша текущая бизнес-модель на самом деле очень проста и позволяет нам масштабироваться. Мы работаем с фирмами венчурного капитала, которые действительно знают бизнес биотехнологий и занимаются разработкой лекарств. Они направляют нас туда, где нам нужно идентифицировать мишени и генерировать маленькие молекулы. Затем они формируют команды вокруг этих маленьких молекул и мишеней из них и позволяют им немного больше проверять и развивать ассоциации этих целевых молекул.
То, что мы получаем это небольшой авансовый платеж, а затем мы получаем промежуточные платежи по мере того, как молекулы проходят различные этапы проверки. Тогда мы получаем роялти. Обычно, если вы рассматриваете BioBox или будущие доходы, которые могут быть получены от молекулы, эти сделки очень, очень существенны, но первоначальный платеж довольно мал.
Вот почему у нас есть другой бизнес, который занимается лицензированием программного обеспечения, где мы лицензируем некоторые из наших программных инструментов другим для получения некоторого дохода и обеспечения устойчивости, согласованности и получения отзывов о том, насколько хорошо работает программное обеспечение; если нам нужно добавить больше возможностей.
Еще одна бизнес-модель — у нас есть несколько совместных площадок. Например, совместное предприятие с компанией под названием Juvenessence. Они развивают молекулы, которые мы им предоставляем.
Майкл Кригсман: Хорошо, у вас есть целый ряд вещей, над которыми вы работаете и пытаетесь поддержать ваши бизнес-модели.
Александр Жаворонков: Верно. Но больше всего нас интересует не непосредственный доход. В большинстве этих лицензионных соглашений мы получаем некоторые данные. Мы в значительной степени стали одной из крупнейших фабрик данных в мире, получая данные из доклинических экспериментов.
Майкл Кригсман: Это интересно. У нас есть еще один вопрос из Твиттера от @TrovatoChristian. Он биомедицинский инженер и доктор философии, студент по вычислительной биологии на факультете информатики в Оксфорде. Кстати, мне очень интересно, что вычислительная биология относится к разделу информатики, а не к разделу биологии. Его вопрос: «Есть ли примеры лекарств, разработанных только ИИ?»
Александр Жаворонков: На данный момент такого примера нет. Всегда есть человек между ИИ и лекарством. Я надеюсь, что в самом ближайшем будущем мы сможем показать, что канал, в котором ни один человек не был вовлечен от идентификации цели до генерации малых молекул, мог бы открыть некоторые из этих молекул. Но на данный момент эксперимент является королем среди методов открытия и разработки лекарств. Так что, если вы не сможете проверить свои методы экспериментально, они не будут продвигаться вперед. Я никогда не видел пример молекулы, которая полностью генерируется с помощью ИИ.
Майкл Кригсман: Что мешает использовать ИИ от начала до конца?
Александр Жаворонков: Ну, из-за неудач в фармации, в общем. Есть очень, очень мало историй успеха, на которых можно поучиться. Эти истории успеха очень и очень разнообразны. В некоторых областях легко проверить, дает ли ваш алгоритм какой-либо значимый вывод. Но во многих случаях вам действительно нужно идти и проверять все на каждом этапе пути. Вот почему, когда вы создаете эту салями, которая позволяет вам переходить от начала к концу, вы должны убедиться, что вы проверяете каждый кусочек салями и проверяете его внутри, а также проверяете его с внешними партнерами. Это то, что мы пытаемся сделать.
Майкл Кригсман: Возможно, что уже существуют методы для разработок ИИ лекарств, но на данном этапе кажется, что испольщовать такие методы слишком рано.
Александр Жаворонков: На данном этапе никто не пытался виртуализировать открытие лекарств полностью с помощью ИИ и делать это без вмешательства человека. Во многих областях это фактически невозможно только потому, что биология и медицина настолько разнообразны, что очень и очень трудно найти решение, которое подойдет всем. Требуется валидация на каждом этапе, и в данный момент эти сквозные конвейеры будут работать только в определенных терапевтических условиях.
Майкл Кригсман: Позвольте мне задать вам еще один вопрос из Твиттера. Это опять от Шрейи Амин, отличный вопрос, интересный. Она пишет: «С использованием существующих методов искусственного интеллекта, какие области с точки зрения типов лекарств, болезней, состояний и т. д. наиболее близки к прорывам или достигли наибольшего прогресса, и что является самым трудным в данном процессе?»
Александр Жаворонков: Я приведу вам пример, с которым я очень, очень хорошо знаком. У нас есть несколько ингибиторов JAK, которые полностью разработаны с использованием GAN и обучения с подкреплением. Я думаю, что это один из самых многообещающих методов для молекулярного дизайна de novo.
В настоящее время мы находимся на стадии тестирования на мышах, прошли весь путь от ферментных анализов до мышей и показали, что теперь мы можем достичь селективности, специфичности с этими молекулами, и эти молекулы обладают многими другими свойствами. Это довольно распространенные методы в наше время, как GAN, который мы использовали, так и методика обучения с подкреплением. Это не что-то супер новое, поэтому мы действительно переключили наши исследования и разработки в несколько ином направлении.
Майкл Кригсман: Как это все будет развиваться в следующие, я не знаю, три, четыре года, два-четыре года? Давай не будем выходить за десяток лет. В течение следующих нескольких лет как все это будет выглядеть?
Александр Жаворонков: Я думаю, что такие компании, как наша, будут уделять гораздо больше внимания своим внутренним исследованиям и разработкам, вместо того, чтобы сотрудничать с крупными фармацевтическими компаниями, потому что сотрудничество с крупными фармацевтическими компаниями — это, как правило, путь в никуда, потому что это либо смерть компании на начальном этапе, либо они просто принимают ваш опыт и догоняют. Но, в то же время, они настолько бюрократичны, что их очень трудно изменить, и в то же время на уровне генеральных директоров крупные фармацевтические компании больше сосредоточены на увеличении продаж или покупке других компаний, чтобы увеличить продажи. Внутренние исследования и разработки на самом деле не рассматриваются как огромный приоритет, и, независимо от того, что они думают, это факт. Обычно должно быть 15-20% в отчете о прибылях и убытках, потому что в противном случае инвесторы не собираются инвестировать в компанию. Но производительность этих внутренних исследований и разработок обычно очень низкая.
Я думаю, что более мелкие биотехнологические компании, которые используют ИИ и виртуализацию открытия лекарств, будут очень успешными. Есть несколько случаев, которыми я восхищаюсь в индустрии, например, Nimbus Therapeutics. Им удалось виртуализировать весь процесс поиска и разработки лекарств, вывести на рынок некоторые активы второй фазы и лицензировать их.
Я думаю, что люди, которые действительно понимают процесс и могут виртуализировать его, будут победителями. До сих пор я знаю несколько компаний, которые делают это, поэтому некоторые компании работают с нами. Некоторые в режиме невидимости. Я думаю, что они будут победителями в будущем.
Когда вы говорите об открытии лекарств через два-три года, на самом деле это очень, очень короткое время. Во многих других областях человеческого развития, если вы попросите меня планировать на пять лет вперед, я не смогу, потому что все меняется очень быстро. В фармации это не так. Нам действительно нужно проводить эксперименты и делать все правильно.
Майкл Кригсман: Расскажите кратко нам о последнем исследовании, которое вы провели в отношении долголетия или курения? Я знаю, что у нас нет времени, но было бы здорово узнать.
Александр Жаворонков: Конечно. Мы только что опубликовали очень забавную статью, показывающую, что курение ускоряет старение. Одной из областей, на которых мы сосредоточены, является прогнозирование возраста с использованием нескольких типов данных, таких как изображения, анализы крови, транскриптомные данные, протеомные данные, микробиомные данные. Мы используем эти данные, чтобы достаточно точно предсказать возраст человека, а затем посмотрим, какие вмешательства или изменения в поведении, какой образ жизни способствуют тому, что человек выглядит моложе или старше.
Мы сделали этот проект в Канаде. Мы работали с Университетом Летбриджа и правительством Альберты, чтобы обработать большой набор данных о курильщиках и некурящих разного возраста, изучая только анонимные анализы крови. Прежде всего, мы создали предиктор статуса курения, поэтому теперь я могу с достаточной уверенностью сказать, курите ли вы или нет, взяв анализ крови, но мы также показали, что люди, которые курят, выглядят старше чем некурящие, исходя из использования глубокой нейронной сети, обученной по анализу крови.
После того, как мы опубликовали статью, она стала довольно вирусной, и мы получили очень положительные отзывы. Например, моя дочь думает бросить курить только потому, что не хочет выглядеть старой. Людей не очень заботит их здоровье, но они действительно заботятся о том, как они выглядят. Если вы не хотите выглядеть старым, просто бросьте курить.
Майкл Кригсман: Хорошо. Отличный совет. Александр, спасибо большое, что нашли время поговорить с нами. Всем хорошего дня. Берегите себя. Пока-пока.
Оригинал
Искусственный интеллект обещает нам лучшее здоровье, более быструю разработку и тестирование лекарств. Все это делается с целью улучшения результатов лечения пациентов. Сегодня мы говорим с мировым экспертом по использованию искусственного интеллекта в науках о жизни, цель которого находить и разрабатывать лекарства быстрее и дешевле.
Александр Жаворонков является основателем и генеральным директором Insilico Medicine. Компания является лидером в области искусственного интеллекта следующего поколения, методы которого направлены на открытие новых лекарств, разработку биомаркеров и исследования старения. До Инсилико он работал на руководящих должностях в ATI Technologies, NeuroG Neuroinformatics, Фонде биогеронтологических исследований и YLabs.AI. С 2012 года он опубликовал более 130 рецензируемых научных статей и 2 книги. В течение шести лет он организовывал ежегодные форумы «Исследования старения для обнаружения лекарств и искусственный интеллект для здравоохранения» в Basel Life / EMBO в Базеле. Александр — адъюнкт-профессор Института Бака по исследованиям старения.
Майкл Кригсман: Расскажите вкратце об Insilico Medicine, а также о том, над чем вы работаете.
Александр Жаворонков: Мы сосредоточены в первую очередь на применении методов искусственного интеллекта следующего поколения для разработки лекарств, разработки биомаркеров, а также исследований старения. Мы ориентируемся конкретно на две техники машинного обучения: генеративно-состязательные сети (GAN) и обучение с подкреплением. Это методы, в которых мы наиболее опытны в своей области.
Мы используем эти методы для двух целей. Одна из них — выявление биологических мишеней и создание биомаркеров из нескольких типов данных, а также создание новых молекул, новых молекулярных структур с определенным набором свойств. Мы были одной из первых компаний, возможно, первой, которая создала новые молекулы, используя новую технологию, называемую генеративно-состязательными сетями, и проверила эти молекулы экспериментально.
Что такое pipeline разработки лекарств?
Майкл Кригсман: Дайте нам некоторый контекст. Что такое pipeline разработки лекарств? Почему это так сложно? Давайте поговорим об этом. Затем мы можем перейти к тому, как ИИ делает это лучше, легче.
Александр Жаворонков: Открытие и разработка лекарств — это очень длительный процесс. Это также один из тех процессов, где у вас больше неудач, чем успехов. На самом деле неудач гораздо больше, чем успехов.
Требуется более 2,6 миллиарда долларов на разработку лекарства и его вывод на рынок для лечения определенного заболевания. Это после того, как молекула была проверена на животных. Кроме того, после того, как молекула была протестирована на животных, уровень отказов составляет 92%. Когда лекарство тестируется на людях, то оно терпит неудачу в 92% случаях. Итак, процесс не только длительный, но и рискованный.
Обычно время, необходимое для открытия и развития молекулы, составляет около десяти лет. Люди, которые инициируют процесс, не всегда присутствуют, когда молекула внедряется. Процесс состоит из нескольких этапов.
Первый — генерация гипотез. Вы выдвигаете гипотезу, теорию определенной болезни и определяете соответствующие мишени. Вы говорите о том, какие белки вовлечены в заболевание и какие белки являются причиной.
После этого вы идете и разрабатываете антитело или небольшую молекулу для этого белка-мишени. Если вы разрабатываете небольшую молекулу, вы обычно начинаете с проверки больших библиотек соединений, которые могут поразить эту конкретную мишень, и проводите всевозможные эксперименты, чтобы увидеть, насколько хорошо эти маленькие молекулы связываются с этой мишенью.
После этого вы выбираете несколько вариантов. Вы определяете, какие молекулы лучше всего подходят для этой белковой мишени, и начинаете проводить всевозможные эксперименты на этих молекулах, чтобы определить, хорошо ли они работают в биологической системе, в анализе, связанном с заболеванием, у мыши, у собаки или других животных, а затем вы подаете заявку на IND (исследование нового лекарства) с FDA, чтобы получить молекулу в клинических испытаниях.
После того, как этот процесс завершен, мы приступаем к разработке лекарств и начинаем клинические испытания. Все начинается с фазы I, которая связана с безопасностью. На фазе II вы проверяете лекарство на эффективность. На фазе III вы тестируете обе фазы в больших клинических условиях, на больших популяциях. После вы можете перейти к фазе IV или начать выпуск продукта.
Открытие лекарств и постмаркетинговое исследование
Александр Жаворонков: А потом постмаркетинговое исследование. Этот процесс обычно занимает более десяти лет и терпит неудачу в 92% случаев.
С ИИ вы действительно можете играть практически во всех сегментах, начиная с открытия лекарств на ранней стадии, когда ИИ может помочь вам с моделью гипотезы и, по сути, вытащить иголки из стога сена с идентификатором мишени, с идентификацией малых молекул, с виртуальным скринингом, с созданием новых молекул с особыми свойствами, с планированием дизайна клинического испытания и включением в клиническое испытание. И затем, также, для прогнозирования результатов клинических испытаний.
Майкл Кригсман: Где ИИ начинает сокращать процесс, делать его лучше?
Александр Жаворонков: Если вы находитесь на ранних этапах разработки лекарства, начали работать над генерацией гипотез и идентификацией мишеней, обычно у вас есть несколько путей, по которым нужно следовать. Одним из способов является поиск литературы и выявление перспективных областей, которые были открыты учеными в прошлом и опубликованы.
ИИ может помочь вам добывать огромное количество литературы, а также другие связанные источники, чтобы определить сигналы и мишени, которые могут быть связаны с болезнью. Мы, в Insilico, обычно начинаем с данных по грантам. Мы смотрим на биомедицинские гранты на сумму около 1,7 трлн долларов за последние 25 лет. Затем мы смотрим, как эти гранты превращаются в публикации, в патенты клинических испытаний, а затем в продукты на рынке.
Мы следуем от идее к идее и от денег к деньгам, то есть от денег на рынке. Мы также смотрим, как деньги становятся данными. Так, обычно, когда правительство поддерживает определенное исследование, данные должны храниться в публичном хранилище, чтобы другие люди могли их копировать, а также для общего блага.
Мы стараемся следить за деньгами в данных. Если данных нет, мы пытаемся связаться с ученым и получить данные от ученого и / или призвать ученого поместить данные в общедоступное хранилище.
Мы начинаем с текстовых баз данных, но также связываем эти данные с омиксными данными. По сути, все, что заканчивается на «омика» ( транскриптомика, геномика, метаболомика, метагеномика), называется омиксными данными.
Мы работаем в основном с данными по экспрессии генов, поэтому мы смотрим, как уровень экспрессии определенных генов или целых сетей меняется, скажем, с здорового состояния на болезнь. Мы преобразуем эти изменения, эти признаки болезни в отдельные мишени, и определяем какие виды белков могут быть нацелены с помощью небольшой молекулы.
Затем мы вернемся к prior art в тексте и посмотрим, опубликовал ли кто-нибудь что-нибудь, что укрепило бы нашу гипотезу. Это не обязательно означает, что наша гипотеза неверна, если в тексте нет сигнала, потому что иногда люди просто не могли реально связать определенную мишень с болезнью, используя более старые методы, но это дает нам немного больше уверенности, чтобы увидеть что кто-то уже затронул эту проблему и эту мишень раньше.
Мы собираем огромные объемы данных, которые просто невозможно обработать с помощью человеческого интеллекта. Мы также собираем и объединяем эти типы данных. Иногда эти типы данных полностью несовместимы, и невозможно просто зашить их вместе с помощью стандартных инструментов. Вам действительно необходимо обучать глубокие нейронные сети одновременно нескольким пакетам данных, чтобы они могли обобщаться и чтобы мы могли извлекать соответствующие функции, присутствующие в нескольких типах данных одновременно.
Некоторые типы данных, с которыми мы работаем, совершенно непостижимы для человеческого разума. Как, например, данные генной экспрессии или данные движения, или данные сканирования сердечно-сосудистой деятельности, или ультразвуковые данные. Нам удается объединить эти типы данных с помощью ИИ, а затем определить соответствующие мишени.
Биология vs искусственный интеллект
Майкл Кригсман: В Insilico ваша основная специализация — биология и медицина или разработка методов искусственного интеллекта? Можно ли разделить эти два направления?
Алекс Жаворонков: В нашем случае оба направления хороши, и мы нанимаем людей на конкурсной основе, на международном уровне. На конкурсах мы проводим очень сложные тесты, которые люди должны очень быстро решить. Эти проблемы обычно связаны с разработкой метода ИИ и решением сложной биологической или химической проблемы.
Однако, когда вы смотрите на действительно великих ученых из ИИ, они, как правило, не очень хороши в биологии или в химии. Они хороши в математике. Вот почему некоторый процент нашей компании — просто замечательные математики, которые разрабатывают новые методы, например, для соединения химии и биологии с использованием глубокого обучения.
Часть компании специализируется на применении уже существующих методов, таких как GAN, и усилении обучения к существующим проблемам в химии и биологии. Эти люди обычно на прикладной стороне, и они знают и химию и биологию. Они могут общаться с математиками, а также проводить некоторые фундаментальные исследования в области ИИ.
Конечно, у нас просто есть чистые биологи и химики, которые также необходимы для проверки некоторых результатов нашего ИИ. Вот почему у нас такая большая, разнообразная и международная команда, потому что нам действительно нужно охватить эти три области: методы, приложения и валидацию.
Майкл Кригсман: У нас есть интересный вопрос от Криса Петерсона в Твиттере, который говорит: «Параллельные программы на Фортране, основанные на гриде, все еще используются для некоторых фармакокинетических и фармакодинамических исследований. Видите ли вы, что ИИ заменяет олдскульный код, усиливает его или развивается параллельно?»
Александр Жаворонков: Думаю, сейчас нам нужно продвигаться параллельно. Конечно, некоторые из старых методов до сих пор используются действительно ведущими экспертами в области открытия лекарств. Но большинство этих методов значительно ускоряются с помощью высокопроизводительных вычислений и искусственного интеллекта, так что это типичное программное обеспечение, которое существует уже очень давно, например, Schrodinger. Компания существует с 92 года.
Компания сделала большой прорыв во многих областях, и им удалось продвинуть старые алгоритмы для решения очень сложных задач. Я думаю, что в Insilico мы пытаемся все заново изобрести и пишем собственное программное обеспечение. Но, конечно, мы знаем многих наших сотрудников, которые просто хотели бы взять маленькие кусочки нашего большого салями, которое мы разрабатываем, и поиграть с ним. Возможно, они используют более классические инструменты, которые мы не можем обойти сейчас.
В идеале необходимо иметь цельный конвейер, который идентифицирует мишени, генерирует молекулы и проводит эти молекулы через большое количество симуляций в одном бесшовном конвейере. Это то, что мы строим, и это наш Святой Грааль. Но, конечно, многие компании, многие группы пытаются сделать игру Lego и пытаются использовать несколько инструментов с разными выходами для решения одной и той же проблемы.
Разработка инструментов AI внутри компании
Майкл Кригсман: Почему вы разрабатываете свои собственные инструменты?
Александр Жаворонков: Да просто потому, что многие из используемых нами методов настолько новы, что несовместимы с более старыми инструментами. Есть много групп, которые утверждают, что занимаются искусственным интеллектом, но, по сути, они занимаются механической работой, беря готовое программное обеспечение и пытаясь преодолеть некоторые пробелы в фармакологических исследованиях и разработках, используя эти инструменты. Мы этого не делаем. Мы разрабатываем все с нуля, от идентификатора мишени до генерации малых молекул.
Майкл Кригсман: Теперь мы говорили об использовании ваших методов для выявления потенциальных кандидатов. Следующим шагом является оценка. Во-первых, мы должны раскрыть возможности, а вы делаете это путем агрегирования всех этих данных и последующего их анализа с использованием различных методов. Допустим вы сделали это. Как вы оцениваете кандидатов, которых вы раскрыли изначально?
Александр Жаворонков: Обычно, когда у вас остается список белков-мишеней для конкретного заболевания и вы пытаетесь расставить приоритеты, вы пытаетесь аннотировать эти белки с максимально возможным количеством баллов. Вы смотрите, была ли эта белок-мишень когда-либо вовлечена в токсичность. Как это связано со всем остальным? В какой ткани он играет большую роль? Как белок взаимодействует с другими белками? Это лекарство? Это лекарственное средство с маленькой молекулой или с антителом? Кто-нибудь еще это использовал? Какое патентное пространство вокруг молекулы? Кто-нибудь пробовал взять его в клинику с маленькой молекулой или антителом для определенного заболевания?
Есть много, много, много, много функций оценки, которые вы должны рассмотреть. В конце, когда у вас в основном остается очень маленький набор мишеней, вы также тестируете их в различных биологических системах, чтобы определить, какая из них более подходит для интересующей вас болезни.
Я приведу пример из практики. Например, нас очень интересует фиброз. Фиброз не очень простой процесс для описания, и существует несколько типов фиброза. Существует IPF, или легочный фиброз. В легких наблюдается индуцированный курением фиброз, кроме этого наблюдается старческий фиброз. Мы идентифицировали более 120 типов фиброза, сравнивая нормальную ткань с фбирозной тканью, связанной с определенным состоянием.
Мы только недавно провели тематическое исследование, в котором мы рассмотрели IPF, определили список мишеней для этого состояния, и в нашем списке было 50 мишеней. Мы смотрели на то, когда эти мишени более активны и более актуальны для заболевания, на какой стадии заболевания, потому что, я думаю, если вы поймете это позже или решите эти вопросы позже, вы будете лечить симптомы, а не причину.
В нашем случае мы определяем большой список мишеней, которые, вероятно, будут очень актуальны на ранней стадии прогрессирования заболевания. Затем мы смотрим на то, какие мишени являются новыми, на какие мишени люди не обращали внимания. Мы не хотим сосредотачиваться на старых мишенях. Затем мы смотрим на то, какие мишени пригодны для лекарств, где мы могли бы на самом деле найти небольшую молекулу из библиотеки или можем создать молекулу с нуля. Затем мы рассматриваем, какие мишени могут быть проверены в конкретном наборе анализов на фиброз.
Майкл Кригсман: Где есть влияние технологий искусственного интеллекта, которые вы используете в этом процессе?
Александр Жаворонков: Обычно для подсчета баллов оценки результата. Вы распределяете несколько баллов для мишеней. В нашем случае мишень имеет более 50 баллов. Мы определяем, была ли она вовлечена в определенное состояние раньше, взаимодействует ли она с другими белками определенным образом, может ли это привести к токсичности. Те предикторы, которые в основном дают вам такую ??оценку и вероятность того, что эта мишень является наиболее релевантной, глубоко изучают и разрабатывают различные организации. Мы разработали свои предикторы с помощью машинного обучения.
Академия vs промышленность
Майкл Кригсман: У нас есть еще один интересный вопрос из Твиттера от Шреи Амин. Она пишет: «Как тип исследования, которое вы описывали, и процессы различаются среди научными кругов и промышленности?»
Александр Жаворонков: Это очень, очень хороший вопрос. В промышленности, в большой фармацевтике, люди немного менее предприимчивы. Они пытаются разработать различные методы, чтобы действительно решить проблему и внести постепенные изменения. Их методы не нацелены на публикацию в научном журнале.
В научных кругах люди гораздо более изобретательны и предприимчивы. Они пытаются опубликовать результаты. Вот откуда инновации, в первую очередь.
Мы, в Insilico, находимся между наукой и промышленностью, поэтому мы публикуем около двух научных работ в месяц. Это даже для некоторых академических групп достаточно, чтобы также доказать концепцию и объяснить куда мы идем.
Академики, я думаю, в наши дни гораздо продуктивнее, будь то разработка новых методов и показ новых направлений. Тем не менее, разрыв между действительно хорошими учеными-компьютерщиками, которые разрабатывают новые методы, которые могут иметь отношение к открытию лекарств, очень часто настолько далеки от биологии и химии. Они выпускают статьи действительно хорошие с точки зрения машинного обучения, но результаты очень далеки от реальных приложений. Очень часто они на самом деле не понимают, что они где-то переоснащены или, если это совершенно не относящийся к делу результат, который они получают или получают, только после того, как кто-то попробует это в биологии и химии.
Очень часто, и в настоящее время такое на самом деле более распространено, многие люди помещают статьи в Архив с броским заголовком так, что они становятся вирусными и выбираются браузерами, Google или некоторыми новостными агентствами. Они получают признание и пиар за эту работу, но затем вы пытаетесь повторить то, что они сделали, или даже просто внимательно прочитаете статью, и вы понимаете, что в реальном мире это не сработает. Я думаю, что такого рода статьи и такие виды усилий, ранние результаты, особенно со стороны академических групп, не проходя экспертную оценку, также внесли большой скептицизм в большую фармацию. Люди просто не думают, что многие методы актуальны, применимы или трансформируют их бизнес.
Создание команды для искусственного интеллекта и биотехнологий
Майкл Кригсман: Давайте поговорим об аспекте построения команды, потому что одна из вещей, которые вы упомянули пару раз, — это важность как возможностей машинного обучения, так и возможностей биологии. Это очень специализированные навыки, и как вы создаете команды, которые позволяют обеим сторонам работать вместе и создавать то, что одна или другая не могут сделать в одиночку?
Алексндр Жаворонков: Это еще один очень хороший вопрос. В нашем случае это одна из причин, почему мы так медленно растем. Мы работаем уже 5 лет, но нас все еще 66 человек. Одна из причин этого медленного, органического роста состоит в том, что требуется время, чтобы действительно объединить ученых ИИ с биологами и химиками. Очень трудно найти людей, которые хороши в обоих случаях одновременно. Обычно вы хорошо разбираетесь в математике или в химии, или вам действительно нужно иметь хорошие навыки программирования, чтобы иметь возможность создавать API и правильно комбинировать вашу технологию с чьей-либо другой.
Мы стараемся работать в группах из трех или четырех человек над конкретными терапевтическими проектами, в которых один человек хорошо разбирается в химии или биологии, один человек хорош в искусственном интеллекте, а другой — просто в базовых ИТ. В основном это команды из трех или четырех человек. Помимо них, существует инфраструктура, организационная инфраструктура, которая помогает управлять этими командами. Мы также отделили команду искусственного интеллекта от всех остальных, чтобы они могли работать над методами, не попадая в прикладную область.
Получить такого рода таланты, которые действительно хотят внести свой вклад в разработку методов и разработать новые алгоритмы, это очень и очень сложно. Получить людей, которые хороши в применении уже разработанных методов, это довольно просто. Заставить двоих работать вместе, это очень сложно. Чтобы сделать это, мы, опять же, пытаемся добиться органического роста и работаем над проектами в небольших командах.
Бизнес-модель Insilico
Майкл Кригсман: На ??самом деле, у нас есть вопрос из Твиттера на тему вашей бизнес-модели. Крис Петерсон задает замечательные вопросы. Большое спасибо, Крис. Он спрашивает: «Вы заключили договор на поиск конкретной терапии или вы разрабатываете молекулы с нуля и надеетесь лицензировать их для клинических испытаний путем распространения?»
Александр Жаворонков: Мы работаем в течение пяти лет, и мы изучили несколько бизнес-моделей. Как компании, занимающейся искусственным интеллектом, вы должны исследовать ее, потому что в противном случае ее очень и очень трудно масштабировать на одной бизнес-модели, и это также довольно рискованно.
Мы начинали как сервисная компания, и мы начали сотрудничать с фармацевтическими компаниями, с биотехнологическими компаниями, а также с венчурными фондами, где мы предоставляли услуги или предоставляли им систему. Мы изучили приложения, которые ищут люди, и начали разрабатывать наши собственные маленькие молекулы, открывать их и затем лицензировать.
Наша текущая бизнес-модель на самом деле очень проста и позволяет нам масштабироваться. Мы работаем с фирмами венчурного капитала, которые действительно знают бизнес биотехнологий и занимаются разработкой лекарств. Они направляют нас туда, где нам нужно идентифицировать мишени и генерировать маленькие молекулы. Затем они формируют команды вокруг этих маленьких молекул и мишеней из них и позволяют им немного больше проверять и развивать ассоциации этих целевых молекул.
То, что мы получаем это небольшой авансовый платеж, а затем мы получаем промежуточные платежи по мере того, как молекулы проходят различные этапы проверки. Тогда мы получаем роялти. Обычно, если вы рассматриваете BioBox или будущие доходы, которые могут быть получены от молекулы, эти сделки очень, очень существенны, но первоначальный платеж довольно мал.
Вот почему у нас есть другой бизнес, который занимается лицензированием программного обеспечения, где мы лицензируем некоторые из наших программных инструментов другим для получения некоторого дохода и обеспечения устойчивости, согласованности и получения отзывов о том, насколько хорошо работает программное обеспечение; если нам нужно добавить больше возможностей.
Еще одна бизнес-модель — у нас есть несколько совместных площадок. Например, совместное предприятие с компанией под названием Juvenessence. Они развивают молекулы, которые мы им предоставляем.
Майкл Кригсман: Хорошо, у вас есть целый ряд вещей, над которыми вы работаете и пытаетесь поддержать ваши бизнес-модели.
Александр Жаворонков: Верно. Но больше всего нас интересует не непосредственный доход. В большинстве этих лицензионных соглашений мы получаем некоторые данные. Мы в значительной степени стали одной из крупнейших фабрик данных в мире, получая данные из доклинических экспериментов.
Майкл Кригсман: Это интересно. У нас есть еще один вопрос из Твиттера от @TrovatoChristian. Он биомедицинский инженер и доктор философии, студент по вычислительной биологии на факультете информатики в Оксфорде. Кстати, мне очень интересно, что вычислительная биология относится к разделу информатики, а не к разделу биологии. Его вопрос: «Есть ли примеры лекарств, разработанных только ИИ?»
Александр Жаворонков: На данный момент такого примера нет. Всегда есть человек между ИИ и лекарством. Я надеюсь, что в самом ближайшем будущем мы сможем показать, что канал, в котором ни один человек не был вовлечен от идентификации цели до генерации малых молекул, мог бы открыть некоторые из этих молекул. Но на данный момент эксперимент является королем среди методов открытия и разработки лекарств. Так что, если вы не сможете проверить свои методы экспериментально, они не будут продвигаться вперед. Я никогда не видел пример молекулы, которая полностью генерируется с помощью ИИ.
Майкл Кригсман: Что мешает использовать ИИ от начала до конца?
Александр Жаворонков: Ну, из-за неудач в фармации, в общем. Есть очень, очень мало историй успеха, на которых можно поучиться. Эти истории успеха очень и очень разнообразны. В некоторых областях легко проверить, дает ли ваш алгоритм какой-либо значимый вывод. Но во многих случаях вам действительно нужно идти и проверять все на каждом этапе пути. Вот почему, когда вы создаете эту салями, которая позволяет вам переходить от начала к концу, вы должны убедиться, что вы проверяете каждый кусочек салями и проверяете его внутри, а также проверяете его с внешними партнерами. Это то, что мы пытаемся сделать.
Майкл Кригсман: Возможно, что уже существуют методы для разработок ИИ лекарств, но на данном этапе кажется, что испольщовать такие методы слишком рано.
Александр Жаворонков: На данном этапе никто не пытался виртуализировать открытие лекарств полностью с помощью ИИ и делать это без вмешательства человека. Во многих областях это фактически невозможно только потому, что биология и медицина настолько разнообразны, что очень и очень трудно найти решение, которое подойдет всем. Требуется валидация на каждом этапе, и в данный момент эти сквозные конвейеры будут работать только в определенных терапевтических условиях.
Майкл Кригсман: Позвольте мне задать вам еще один вопрос из Твиттера. Это опять от Шрейи Амин, отличный вопрос, интересный. Она пишет: «С использованием существующих методов искусственного интеллекта, какие области с точки зрения типов лекарств, болезней, состояний и т. д. наиболее близки к прорывам или достигли наибольшего прогресса, и что является самым трудным в данном процессе?»
Александр Жаворонков: Я приведу вам пример, с которым я очень, очень хорошо знаком. У нас есть несколько ингибиторов JAK, которые полностью разработаны с использованием GAN и обучения с подкреплением. Я думаю, что это один из самых многообещающих методов для молекулярного дизайна de novo.
В настоящее время мы находимся на стадии тестирования на мышах, прошли весь путь от ферментных анализов до мышей и показали, что теперь мы можем достичь селективности, специфичности с этими молекулами, и эти молекулы обладают многими другими свойствами. Это довольно распространенные методы в наше время, как GAN, который мы использовали, так и методика обучения с подкреплением. Это не что-то супер новое, поэтому мы действительно переключили наши исследования и разработки в несколько ином направлении.
Майкл Кригсман: Как это все будет развиваться в следующие, я не знаю, три, четыре года, два-четыре года? Давай не будем выходить за десяток лет. В течение следующих нескольких лет как все это будет выглядеть?
Александр Жаворонков: Я думаю, что такие компании, как наша, будут уделять гораздо больше внимания своим внутренним исследованиям и разработкам, вместо того, чтобы сотрудничать с крупными фармацевтическими компаниями, потому что сотрудничество с крупными фармацевтическими компаниями — это, как правило, путь в никуда, потому что это либо смерть компании на начальном этапе, либо они просто принимают ваш опыт и догоняют. Но, в то же время, они настолько бюрократичны, что их очень трудно изменить, и в то же время на уровне генеральных директоров крупные фармацевтические компании больше сосредоточены на увеличении продаж или покупке других компаний, чтобы увеличить продажи. Внутренние исследования и разработки на самом деле не рассматриваются как огромный приоритет, и, независимо от того, что они думают, это факт. Обычно должно быть 15-20% в отчете о прибылях и убытках, потому что в противном случае инвесторы не собираются инвестировать в компанию. Но производительность этих внутренних исследований и разработок обычно очень низкая.
Я думаю, что более мелкие биотехнологические компании, которые используют ИИ и виртуализацию открытия лекарств, будут очень успешными. Есть несколько случаев, которыми я восхищаюсь в индустрии, например, Nimbus Therapeutics. Им удалось виртуализировать весь процесс поиска и разработки лекарств, вывести на рынок некоторые активы второй фазы и лицензировать их.
Я думаю, что люди, которые действительно понимают процесс и могут виртуализировать его, будут победителями. До сих пор я знаю несколько компаний, которые делают это, поэтому некоторые компании работают с нами. Некоторые в режиме невидимости. Я думаю, что они будут победителями в будущем.
Когда вы говорите об открытии лекарств через два-три года, на самом деле это очень, очень короткое время. Во многих других областях человеческого развития, если вы попросите меня планировать на пять лет вперед, я не смогу, потому что все меняется очень быстро. В фармации это не так. Нам действительно нужно проводить эксперименты и делать все правильно.
Исследования долголетия и курения
Майкл Кригсман: Расскажите кратко нам о последнем исследовании, которое вы провели в отношении долголетия или курения? Я знаю, что у нас нет времени, но было бы здорово узнать.
Александр Жаворонков: Конечно. Мы только что опубликовали очень забавную статью, показывающую, что курение ускоряет старение. Одной из областей, на которых мы сосредоточены, является прогнозирование возраста с использованием нескольких типов данных, таких как изображения, анализы крови, транскриптомные данные, протеомные данные, микробиомные данные. Мы используем эти данные, чтобы достаточно точно предсказать возраст человека, а затем посмотрим, какие вмешательства или изменения в поведении, какой образ жизни способствуют тому, что человек выглядит моложе или старше.
Мы сделали этот проект в Канаде. Мы работали с Университетом Летбриджа и правительством Альберты, чтобы обработать большой набор данных о курильщиках и некурящих разного возраста, изучая только анонимные анализы крови. Прежде всего, мы создали предиктор статуса курения, поэтому теперь я могу с достаточной уверенностью сказать, курите ли вы или нет, взяв анализ крови, но мы также показали, что люди, которые курят, выглядят старше чем некурящие, исходя из использования глубокой нейронной сети, обученной по анализу крови.
После того, как мы опубликовали статью, она стала довольно вирусной, и мы получили очень положительные отзывы. Например, моя дочь думает бросить курить только потому, что не хочет выглядеть старой. Людей не очень заботит их здоровье, но они действительно заботятся о том, как они выглядят. Если вы не хотите выглядеть старым, просто бросьте курить.
Майкл Кригсман: Хорошо. Отличный совет. Александр, спасибо большое, что нашли время поговорить с нами. Всем хорошего дня. Берегите себя. Пока-пока.
Оригинал
Комментарии (10)
Vinchi
21.02.2019 02:49очень плохой перевод, даже видимо автоматический. Перечитайте внимательно сами и исправьте.
EvilGenius18
В России вот минздрав и министр зравоохранения позволяют аптекам продавать гомеопатические лекарства (пустышки), умышлено нанося людям вред и создавая недоверие к препаратам/науке/ИИ.
Не плохо было бы еще применять ИИ для восстановления репутации медицины и борьбы вот с такими проблемами, а то получается, что сначала исправляем последствия, а не причины неэффективности разработки лекарств.
Ariez
Я вам и без ИИ намекнул бы, как врач, с чего начать стоит чтоб восстановить репутацию медицины, начать бороться с гомеопатией и прочим шарлатанством.
Но намекать не буду. Это, боюсь, противоречит 5 пункту правил сайту и УК РФ =)
teecat
Я бы начал еще с повышения зарплат и ремонта зданий. Недавно пришлось полежать центральной районной больнице. И это была не какая-то селькая больничка. Ближнее подмосковье
fareloz
Но стоит отметить, что минздрав России признал гомеопатию — лженаукой. А продавать в аптеке разве можно запретить? Ведь есть еще БАДы и так далее.
Ariez
Если это и впрямь так — поделитесь ссылочкой, пожалуйста.
Про меморандум комиссии по лженауке РАН я в курсе, но минздрав вроде как поддерживал гомеопатию…
fareloz
Да, Вы правы, это были РАН. Извините, не очень разбираюсь в структурах чужого государства.
Ariez
В этом вся беда. На комиссию покатили очень много бочек. И минздрав с ними не согласился. И в университетах продолжают существовать кафедры, выдающие сертификаты по гомеопатии и т.д…
Matshishkapeu
Это не уникально российская фича. Гомеопатию не палясь продают в аптеках Франции, в Англии она (по крайней мере до недавнего времени) покрывалась медстраховкой, вместе с париками для лысеющих мужчин, увеличением сисек для страдающих женщин (хотя хирургическое восстановление травмированных крестовых связок колена не покрывалось или покрывалось не всегда)