Зарождение совместных вычислительных средств для Human Cell Atlas
Специалист по вычислительной статистике Ким-Анх Ля Цао, работающая с ученым CZ Biohub Анджелой Писко.
Клетки являются фундаментальными единицами жизни, но нам еще многое предстоит узнать об их основной функции и организации. Существуют тысячи типов клеток и триллионы отдельных клеток, работающих в сложных системах дабы обеспечить многообразие функций в нашем организме, начиная от иммунной системы, заканчивая мозгом. Новые экспериментальные технологии для характеристики отдельных клеток — в сочетании с правильными вычислительными подходами — могут помочь нам осмыслить эту сложность и начать ее организовывать.
Human Cell Atlas (HCA) — это амбициозное глобальное сотрудничество для создания открытой справочной карты всех клеток в организме человека путем всестороннего описания типов клеток, их количества и пространственных местоположений. После завершения он станет фундаментальным ресурсом для ученых, позволяя им лучше понять, как работают здоровые клетки, и что с ними происходит не так, когда болезнь наносит удар. Но сборка, интеграция, анализ и совместное использование этого ресурса требует новой облачной инфраструктуры данных и новых аналитических методов обработки и интерпретации больших и сложных различных наборов данных.
CZI поддерживает Human Cell Atlas посредством предоставления грантов, инфраструктуры данных, совместной разработки программного обеспечения с открытым исходным кодом и поддержки совместных исследований. В рамках этих усилий CZI Science недавно организовала четырехдневную конференцию более чем 200 ученых, вычислительных биологов и инженеров-программистов, чтобы положить начало созданию совместных вычислительных инструментов для Human Cell Atlas — серию из 85 грантов для исследователей, нацеленных на совместную работу для решения вычислительных задач для HCA.
Планирование конференций для сотрудничества
В CZI мы считаем, что многопрофильные команды, работающие вместе, ускоряют науку, особенно в точке пересечения биологии, вычислений и разработки программного обеспечения. Но как мы можем использовать наши научные конференции, чтобы помочь наладить сотрудничество? Эта встреча дала возможность опробовать некоторые идеи.
Перед конференцией мы сгруппировали проекты в 12 свободных исследовательских областях, организованных вокруг типов данных, аналитических методов и программных экосистем. Мы назвали эти группы так: состояние клеток, тип клеток, изображения, multiomics, траектории, регулировка многообразия, вариации численности, потенциальные пространства, сжатие, масштаб, порты и Bioconductor. Некоторые из этих групп уже фактически применялись вместе — другие встречались друг с другом впервые.
Мы попросили каждую группу представлять свои работы в виде единого целого, чтобы у нас было 12 групповых презентаций, а не 85 отдельных проектов, — и у нас были оживленные телеконференции для подготовки к выступлениям до начала собрания. Эта непринужденная организация и телеконференции перед встречей помогли разрядить обстановку, когда люди приехали. Мы также разработали веб-сайт встречи со ссылками на репозитории, слайды, документы и другие проекты, которые были объединены в онлайн-центр в течение встречи.
В первый день 12 групп представили свои проекты. После этих 12 презентаций группы затем провели следующие два с половиной дня, работая вместе, чтобы лучше «разделить» работу, которую они могли бы выполнять в течение одного года (периода длительности проекта), придавая особое значение связующим нитям, таким как общие метрики и контрольные наборы данных для определения относительного успеха различных алгоритмов, стандартов данных и стандартов метаданных или интеграции с различными средствами программирования экосистем. Чтобы добавить некоторую структурированность, мы также представили четыре параллельных обучающих сессии, которые помогут обучать целому ряду тем и информировать о них: инструменты для современной веб-визуализации данных, платформу для координации данных Human Cell Atlas, используя и улучшая bioRxiv для вычислительной биологии и совместного программирования с Github.
Мы выделили много времени на собрании, чтобы группы могли поработать, начиная от времени выделенного для совместного программирования, заканчивая массовым мозговым штурмом, разбавленным презентациями от приглашенных о текущих крупных экспериментальных и вычислительных затратах, связанных с HCA, — включая вдохновляющую основную информацию от Даны Пеер, лидера вычислительного сообщества HCA.
Встреча закончилась презентациями слушателей о том, что они сделали и о том, как продолжать работать вместе. Мы оставили много нераспланированного времени, как для работы, так и для социального взаимодействия, чтобы способствовать открытому обсуждению и построению отношений. Выбор места проведения, который бы обеспечивал участников как пространством для собраний, так и проживанием, помогал в создании сообщества. Кураторские контрольные наборы данных в Github могут длиться год, но смор и караоке на пляже — это связь, которая может длиться на протяжении всей научной карьеры.
Продолжение дискуссии с костром на берегу океана.
Спасибо @cziscience за удивительную встречу. Это была самая продуктивная, коллективная и вдохновляющая встреча, на которой я присутствовал на протяжении всей своей карьеры!
— Duygu@duyguucar
Что мы узнали
Три аспекта встречи были особенно вдохновляющими. Во-первых, группы были действительно рады сотрудничать при предоставлении времени, пространства и инструментов. Во-вторых, студенты и ученые-сотрудники наряду с PI придали энергии собранию и, вероятно, помогли убедиться, что работа в самом деле будет выполнена! В-третьих, внедрение нескольких вычислительных биологов и инженеров-программистов CZI помогло способствовать сотрудничеству на собрании — наша команда очень много узнала от грантополучателей о проблемах на местах, а также помогла создать межотраслевые вычислительные возможности и сотрудничества.
Все были вовлечены в эту новую структуру собраний по своему: в лучших случаях группы разъясняли видение и масштаб своих проектов, иногда буквально курируя или определяя контрольные наборы данных или записывая прототип кода. Мы также были впечатлены группами, которые нашли конкретные возможности для участия в совместном сотрудничестве с CZI с открытым исходным кодом: Джош Мур из проекта OMERO теперь работает с командой Starfish над форматам данных для транскриптомики на основе изображений, а Райан Уильямс и Cotton Seed от группы масштабирования разрабатывают более масштабируемые подходы для хранения и вычисления матриц в Платформе координации данных.
Мы также были в восторге от того, что разработчики из трех ключевых программных пакетов для одноядерного анализа — Scanpy, Seurat и Scater — достигли прогресса в улучшении функциональной совместимости своих инструментов и форматов данных. Просто находясь в одной комнате, и располагая временем и поддержкой можно стимулировать прогресс.
@DrAnneCarpenterБыло действительно здорово видеть, что на этом собрании собралось сообщество специалистов в области вычислений HCA. Как один из участников сказал одному из нас, он чувствовал себя «древесным топливом вычислительной науки», и мы не могли не согласиться. Мы рады, что CZI Science смогла помочь дать начало таким захватывающим взаимодействиям, и мы надеемся использовать эту встречу в качестве модели, поскольку мы продолжаем запускать все больше проектов.
Chan Zuckerberg Science делает удивительные вещи для науки.
Но работа с ними также была удивительной в культурном отношении. Это привело к научным дискуссиям с другими женщинами-специалистами в области вычислений моего возраста (первыми для меня!). Это способствовало созданию связей с разными областями, программными проектами, дисциплинами. Браво!
— Энн Карпентер
Чтобы узнать больше о работе в науке, посетите наш веб-сайт или подпишитесь на нас в Twitter. Чтобы узнать больше о нашей технологической команде, подписывайтесь на технологический блог CZI. Чтобы оставаться в курсе возможностей финансирования, подпишитесь на нашу рассылку. И вы всегда можете связаться с нами по адресу science@chanzuckerberg.com.
Джереми Фриман, директор, специалист в области вычислительной биологии
Джереми — ученый, работающий с пересечением биологии и техники. Он хочет понять, как работают биологические системы, и использовать это понимание в интересах как здоровья человека, так и дизайна интеллектуальных систем. Он изучал компьютерное зрение в магистратуре в Нью-Йоркском университете, возглавлял исследовательскую лабораторию нейронауки в Janelia Research Campus HHMI и в настоящее время находится в Chan Zuckerberg Initiative, ведя нашу работу над сферами, где пересекаются вычисления и биология. Он увлекается открытым исходным кодом и открытой наукой, а также объединяет ученых и инженеров по целому ряду направлений.
Арне Баккер, менеджер, занимающийся научными собраниями и отзывами
Арне Баккер является руководителем научных совещаний в научной группе Chan Zuckerberg Initiative. У него есть докторская степень в области опухолевой иммунологии из Нидерландского онкологического института, а также его исследования в Калифорнийском университете в Беркли. Совсем недавно Арне был помощником декана по трудовому обучению для магистров и начинающих ученых в звании доктора наук в Стэнфордском университете. На протяжении всей своей карьеры Арне активно привлекал ученых: он был директором фестиваля Discovery в Амстердаме, совместно организовал Beyond Academia в Калифорнийском университете в Беркли и PhD Pathways в Стэнфорде, и вызвался на фестиваль науки района залива. В CZI Арне совмещает уроки, который он извлек из этой многогранной карьеры, чтобы возглавлять наши усилия по объединению ученых посредством встреч, семинаров и других совещаний с целью создания и поддержки совместных научных сообществ.
Перевод: Диана Шеремьёва
Про #philtech
#philtech (технологии + филантропия) — это открытые публично описанные технологии, выравнивающие уровень жизни максимально возможного количества людей за счёт создания прозрачных платформ для взаимодействия и доступа к данным и знаниям. И удовлетворяющие принципам филтеха:
1. Открытые и копируемые, а не конкурентно-проприетарные.
2. Построенные на принципах самоорганизации и горизонтального взаимодействия.
3. Устойчивые и перспективо-ориентированные, а не преследующие локальную выгоду.
4. Построенные на [открытых] данных, а не традициях и убеждениях
5. Ненасильственные и неманипуляционные.
6. Инклюзивные, и не работающие на одну группу людей за счёт других.
Акселератор социальных технологических стартапов PhilTech — программа интенсивного развития проектов ранних стадий, направленных на выравнивание доступа к информации, ресурсам и возможностям. Второй поток: март–июнь 2018.
Чат в Telegram
Сообщество людей, развивающих филтех-проекты или просто заинтересованных в теме технологий для социального сектора.
#philtech news
Телеграм-канал с новостями о проектах в идеологии #philtech и ссылками на полезные материалы.
Подписаться на еженедельную рассылку
1. Открытые и копируемые, а не конкурентно-проприетарные.
2. Построенные на принципах самоорганизации и горизонтального взаимодействия.
3. Устойчивые и перспективо-ориентированные, а не преследующие локальную выгоду.
4. Построенные на [открытых] данных, а не традициях и убеждениях
5. Ненасильственные и неманипуляционные.
6. Инклюзивные, и не работающие на одну группу людей за счёт других.
Акселератор социальных технологических стартапов PhilTech — программа интенсивного развития проектов ранних стадий, направленных на выравнивание доступа к информации, ресурсам и возможностям. Второй поток: март–июнь 2018.
Чат в Telegram
Сообщество людей, развивающих филтех-проекты или просто заинтересованных в теме технологий для социального сектора.
#philtech news
Телеграм-канал с новостями о проектах в идеологии #philtech и ссылками на полезные материалы.
Подписаться на еженедельную рассылку