В прошлом году НИУ ВШЭ — Санкт-Петербург и компания BIOCAD открыли магистерскую программу для физиков, математиков и программистов “Вычислительная биология и биоинформатика”. А годом ранее, в 2020-м, запустили экспериментальный трек по биоинформатике (о чем мы кратко рассказывали в этом посте). Сегодня мы поговорили с первым (и единственным!) выпускником трека Ярославом Гераськиным о том, почему он после бакалавриата ВМК МГУ уехал в Питер, променял компьютерное зрение на биоинформатику и как устроился в BIOCAD в начале второго курса.
— Ярослав, ты окончил бакалавриат ВМК МГУ и во время учёбы стажировался в крупных IT-компаниях. Почему решил пойти в магистратуру, а не на full-time работу, ведь возможности были?
— Я стажировался в Яндексе после 2-го курса бакалавриата. Потом пошел в Huawei, куда меня позвали однокурсники из МГУ. В компании я работал чуть больше года, последние 6 месяцев — full-time. Из Huawei я ушел, чтобы доделать диплом и спокойно окончить бакалавриат. Были возможности вернутся туда после защиты, но я решил, что поработать еще успею, и продолжил обучение. Думаю, что если бы я ушел после бакалавриата, вряд ли когда-нибудь вернулся к обучению в магистратуре.
— Как после Москвы ты оказался в Питерской Вышке? Почему не продолжил учиться в родном МГУ, не пошёл на Физтех или ФКН?
— Я оканчивал школу в Москве. Когда выбирал университет, рассматривал и Питер тоже, но на четыре года переезжать не хотелось. Однако желание пожить в Петербурге за время бакалавриата не исчезло, поэтому следующие два года я решил провести здесь. Кроме того, магистерских программ по биоинформатике достаточно мало. Некоторые из них нацелены на биологов и там меньше курсов, связанных с программированием. Программа в Питерской Вышке мне в этом плане отлично подходила.
— Раньше ты занимался компьютерным зрением, сейчас – биоинформатикой. Почему решил сменить сферу деятельности? Чем тебя привлекла биоинформатика?
— Я занимался задачами компьютерного зрения на работе в Huawei и в МГУ. На кафедре было несколько научных групп: «Компьютерная графика», «Компьютерное зрение» и другие. Так вот я был в группе компьютерного зрения.
Мне хотелось научиться применять машинное обучение в каких-то других научных областях, при этом имея достаточно глубокие знания самой области. Понимать, что за задачу я решаю, для чего она нужна, уметь самому переводить задачи другой предметной области на язык, понятный тем, кто занимается машинным обучением. В биоинформатике достаточно много сложных и интересных задач (как исследовательских, так и прикладных), где требуется ML. Это меня и заинтересовало.
— Расскажи, как проходило обучение: интенсивность, курсы, преподаватели.
— В первом модуле в основном были общие курсы по математике и программированию, которые вели преподаватели ВШЭ. Начиная со второго модуля начались курсы от сотрудников BIOCAD: молекулярная биология, функциональное программирование, алгоритмы в биоинформатике. Чем дальше, тем большую долю дисциплин читали сотрудники BIOCAD и тем более специфичными были сами курсы.
Во втором семестре у меня был курсовой проект, который нужно защитить летом. Темы курсовых предлагала компания, кураторы проектов тоже были оттуда. Знаю, что теперь не все проекты дает BIOCAD, в этом году у магистрантов были задачи и от других биотехнологических компаний.
На втором году обучения основную часть курсов также читали сотрудники BIOCAD. В конце магистратуры, конечно, надо было написать диплом, чем я и занялся, пойдя работать в BIOCAD. Получается, что последние полгода я в основном работал над ВКР. Еще вел один из семинаров у магистрантов, которые были на год младше меня, уже как сотрудник компании.
Вообще курсов достаточно много. У людей, которые не занимались математикой и программированием, может уходить прилично времени на домашние задания и учебу в целом. У меня особых сложностей не возникало, потому что значительная часть общих курсов уже была в бакалавриате в гораздо бо́льшем объеме.
— Что для тебя оказалось самым сложным за эти два года?
— Пожалуй, самым сложное — это курсовая работа и диплом. С курсовой были странности с организацией и количеством тем, из которых можно было выбирать: три проекта на трех человек. В этом году ситуация поменялась, как минимум тем курсовых стало больше, чем студентов. Кроме того, появились проекты от других компаний, ну и вообще организация курсовых работ на мой взгляд улучшилась.
— Расскажи, кем ты сейчас работаешь и чем занимаешься.
— Я присоединился к команде алгоритмической структурной биоинформатики BIOCAD в ноябре прошлого года. Команда разрабатывает инструменты, в основе которых лежат алгоритмы и машинное обучение. Эти инструменты используются структурными биоинформатиками на ранних этапах разработки лекарств, позволяя ускорить эту самую разработку.
— А насколько сложно тебе было совмещать магистратуру с работой?
— Сначала я работал три дня в неделю. По сути я занимался дипломом, который заключался в разработке модели машинного обучения для предсказания трехмерной структуры антител. Эта модель в итоге стала одним из инструментов, разработанным в отделе алгоритмической биоинформатики. Сейчас, наряду с другими инструментами предсказания структур, модель используется структурными биоинформатиками.
За два месяца до защиты я перешел на full-time, продолжая заниматься дипломом: писал текст, проводил финальные эксперименты. Таким образом, совмещать работу и учебу у меня получалось вполне неплохо.
— В бакалавриате ты занимался олимпиадным программированием и участвовал в ICPC. Расскажи, пожалуйста, об этом поподробнее. Помогает ли тебе сейчас опыт олимпиадного программирования в учёбе и работе?
— Олимпиадным программированием я начал заниматься примерно в 10-м классе. В 11-м поехал на Всероссийскую олимпиаду школьников по информатике и занял там призовое место, что дало мне возможность поступить в вуз без экзаменов.
Для командных олимпиад в школе и университете я не тренировался специально, мы собирались с ребятами и приходили писать туры без отдельной подготовки. Нам просто было интересно, без больших амбиций и соответствующих тренировок.
Занимаясь олимпиадным программированием, я хорошо прокачал алгоритмы, структуры данных и математику. Это помогло мне сдать соответствующие курсы в бакалавриате и магистратуре. В работе опыт олимпиадных задач пригождается скорее косвенно: быстрее пишешь код, знаешь детали языков программирования, про которые не рассказывают в университете. Всё-таки рабочие задачи сильно отличаются от олимпиадных.
— Кому ты советуешь идти на эту магистерскую программу, и какое напутствие можешь дать абитуриентам?
— Насколько я знаю, на программу можно поступать после любого бакалавриата. Но людям без математической подготовки придется сильно сложнее из-за высокой нагрузки в первых семестрах, где повторяются общие предметы, которые уже были у математиков, программистов, физиков и технарей.
В области биоинформатики достаточно мало хороших разработчиков со знанием предметной области, программа сделана скорее для математиков и программистов, которые хотят погрузиться в биологию и начать работать с биоинформатическими задачами. Если вы не знаете биоинформатику и биологию (как я два года назад), но вам очень хочется, то это программа для вас. Даже если вы решите не оставаться в этой области после обучения, курсы по алгоритмам и машинному обучению могут пригодиться во множестве других областей.
Если вы заинтересовались магистерской программой или у вас есть вопросы по поступлению, приходите в наш Telegram-чат – всё расскажем. Приём документов продлится до 26 июля.
BraveDev
Фотка сделана на Володарском мосту в СПБ.