Сентябрь – волнительное время не только для школьников и студентов, но и для нас в ABBYY. Осенью студенты наших кафедр на Физтехе вернулись к учебе, а десятки наших коллег – к преподаванию. Каким будет этот учебный год – не загадываем. Просто пусть все будет хорошо. А в этом посте мы расскажем интересные подробности о Физтех-школе прикладной математики и информатики (ФПМИ МФТИ) и о том, как вместе с ней мы уже не первый год готовим крутых специалистов в области Natural Language Processing (NLP) и Computer Vision (CV).

image
Первокурсники ФПМИ на фоне самого популярного корпуса МФТИ для совместных фотографий.

Формально ФПМИ молод. Но уже очень мудр. Поясним: физтех-школа появилась в 2016 году, объединив факультет инноваций и высоких технологий (ФИВТ), созданный в 2006 году, и факультет управления и прикладной математики (ФУПМ), открытый более 50 лет назад.

Эти факультеты, ставшие основой ФПМИ, окончили многие известные люди. Перечислим часть из них:


Среди совсем молодых звезд:

  • Юрий Гарнов, основатель стартапа TimeAdge. Интервью с ним можно почитать здесь.
  • Иван Глушенков – основатель популярного сообщества разработчиков Russian Hackers, сооснователь компании по организации хакатонов Phystech Genesis, многократный победитель и призёр международных и российских хакатонов.

Как видно из примеров выше, многие студенты находят работу по специализации или становятся предпринимателями уже на 3-4 курсе и становятся востребованы до получения диплома. Некоторые учащиеся магистратуры получают офферы с релокацией от крупнейших IT-компаний и совмещают учебу с международной карьерой.

Чем ФПМИ отличается от других Физтех-школ? Физтех-школа прикладной математики и информатики специализируется на образовании и исследованиях в области соприкосновения математики, физики, программирования и компьютерных наук. Это сочетание позволяет предлагать своим абитуриентам выбор из большого количества программ и кафедр по самым разным направлениям.

Ежегодно в ФПМИ поступают более 460 первокурсников, большинство из них – на бюджетные места. 90% заканчивающих бакалавриат остаются учиться в магистратуре. В этом году в магистратуру поступило около 470 студентов, а в аспирантуру — около 73. Всего на ФПМИ более 50 магистерских программ по пяти основным направлениям: машинное обучение, программирование, математика, физическое моделирование и экономика/консалтинг.

В Физтех-школе открыты 30 базовых кафедр различных научно-исследовательских центров (МИАН РАН, ИППИ РАН, ИСП РАН, ФИЦ ИУ РАН и др.) и компаний-партнеров, например, ABBYY, Яндекса, SberTech, Huawei, Tinkoff, S7 Group и других. При их поддержке создана 21 научная лаборатория. Всего на ФПМИ обучаются 2450 студентов – это треть от общего числа учащихся на Физтехе.

image
Корпус прикладной математики (КПМ), где расположены почти все школьные кафедры ФПМИ

В ФПМИ студентов и их научно-исследовательскую работу поддерживают разнообразными стипендиями. Помимо государственной, есть грант президента, Абрамовская стипендия, а также поддержка от компаний-партнеров. Например, в этом году ABBYY учредила стипендию для поощрения научных исследований в области мультимодальности и анализа социальных сетей. Кстати, еще можно успеть подать заявку на этот грант до 27 сентября, детали можно найти по ссылке.

Так, и, кажется, мы еще не упомянули о главном. Физтех-школой прикладной математики и информатики руководит Андрей Михайлович Райгородский, доктор физико-математических наук, профессор, лауреат Премии Президента России, заведующий двумя лабораториями и одной кафедрой.


А.М.Райгородский — студентам: «Ботайте, друзья мои, ботайте!»

«Я счастлив, когда вижу, как активно и живо мы растем и развиваемся, как вместе мы делаем уникальное дело. Желаю всем успехов в учебе, в олимпиадах, в проектах, в науке. Приходите к нам!»


Чем на самом деле занимаются на кафедрах ABBYY


Две кафедры ФПМИ созданы совместно с ABBYY: кафедра компьютерной лингвистики (КЛ), открытая 9 лет назад, и кафедра распознавания изображений и обработки текста (РИОТ), которая существует уже 14 лет. Почему появились эти кафедры? Наша цель – находить талантливых ребят с нестандартным мышлением и развивать их способности. В будущем они будут заниматься сложными и амбициозными задачами, которые до них еще никто не решал. И не исключено, что эти ребята будут работать именно в ABBYY.

Обе кафедры ABBYY расположены на территории компании. Здесь ребята и учатся, и участвуют в стажировках и проектах компании, чтобы приобрести опыт, необходимый для дальнейшей работы. Это удобно и для наших сотрудников, которые преподают: им не нужно тратить время на дорогу из института до работы и обратно. А еще офис ABBYY находится не так далеко от Долгопрудного, где расположен Физтех.

image
Результаты работы кафедр ABBYY.
* 20 патентов были зарегистрированы на территории США.


О том, как в этом году проходил набор на кафедры ABBYY и как организовано обучение, на Хабре в марте рассказывал наш студент, на тот момент четверокурсник, Alexey__Petrov. О его впечатлениях можно почитать в этом посте. Тем, кто хочет еще больше информации, рекомендуем видеозапись с презентации кафедр ABBYY. Вы узнаете не только об учебном процессе, но и об историях карьеры нескольких наших сотрудников.

В этом году к нам на бакалавриат подали заявки 137 студентов, и в результате конкурсных испытаний поступило 28 из них. Учиться на кафедре они начнут в следующем году, в весеннем семестре. Всего обучение продлится 1,5 года. Вот что ребята говорят о выборе кафедры:

Тимур и Артем Нургалиевы, кафедра КЛ:

Тимур: «Мы с братом вместе с детства: учились в одном классе, затем в одной группе, а теперь будем учиться на одной кафедре. При поступлении в МФТИ я хотел заниматься наукой, но программирование зацепило сильнее. При этом для меня необходимым условием в будущей профессии является возможность для творчества. Так что через несколько лет вполне могу совместить технологии с рисованием мультфильмов или карьерой блогера!»

Артем: «Когда все выбирали кафедру, мы с братом и другом создали общий документ, в который каждый вписал критерии для оценки. В процессе мы вместе тщательно оценивали все кафедры, и кафедры ABBYY победили. Мне бы хотелось, чтобы моя работа приносила пользу, и я надеюсь, что в этом у нас с ABBYY много общего. Мне нравится программирование, потому что оно открывает возможности создавать что-то необычное. Если объединить это с долей креатива и удачи, можно добиться многого!»


Роман Галкин, кафедра РИОТ: «Кафедра ABBYY — одна из немногих, где можно на бакалавриате погрузиться в область компьютерного зрения. Это и стало ключевым фактором при выборе. Сейчас мне наиболее интересно машинное обучение, хочу углубиться в Computer Vision. В будущем хочу запустить продукт, основанный на машинном обучении. Среди идей бизнеса есть такие, где нужны навыки работы с изображениями и видео. Надеюсь, знания, которые получу на кафедре, помогут мне в этом!»


В магистратуру на кафедрах ABBYY в этом году подали заявки 46 студентов, из них к нам поступили 18 ребят.

Никита Честнов, 5 курс, кафедра РИОТ: «До поступления на кафедру РИОТ я учился на кафедре лазерных систем и структурированных материалов (Физтех-школа физики и исследований им. Ландау). Я выбрал магистратуру ABBYY, потому что это лучшее место для участия в ведущих исследованиях в области компьютерного зрения.

Я бы хотел погрузиться в исследования и стать специалистом в области компьютерного зрения. Сейчас мне интересна задача NAS (поиск нейронной архитектуры) в приложении к области CV. Это направление позволяет намного эффективнее проектировать нейронные сети, из-за чего они лучше справляются с поставленными задачами, чем спроектированные человеком».



Ксения Клокова, 5 курс, кафедра КЛ: «Я получила экономическое образование, но через какое-то время после окончания бакалавриата поняла, что хочу развиваться в data science. Меня всегда интересовал язык как феномен и обработка текстовой информации, и именно поэтому я начала читать различные статьи, проводить эксперименты. В итоге я приняла решение, что хочу строить научную карьеру в сфере компьютерной лингвистики. Обучение на кафедре — это возможность продвинуться к этой цели и перенять знания у лучших специалистов и ученых.

Сейчас я работаю продуктовым аналитиком в команде клиентского сервиса банка. Мы активно внедряем различные системы обработки текстовой информации, поэтому в дальнейшем я могу заниматься разработкой новых прикладных решений и одновременно развивать научную карьеру. Мне интересны семантические парсеры и возможность использования информации из семантических представлений в машинном переводе».



Среди наших выпускников есть те, кто учился на кафедре ABBYY, работал у нас, а затем перешел в более крупные международные IT-компании. Например, наш выпускник и бывший коллега Игорь Холопов закончил кафедру РИОТ, в ABBYY прошел путь от младшего до старшего разработчика, а сейчас занимается облачными технологиями в Google в Европе. В американского гиганта также перешла Наташа Болоболова, до этого она училась на кафедре РИОТ. Алексей Журавлев, выпускник и аспирант кафедры РИОТ, бывший руководитель группы Computer Vision Research в ABBYY и автор двух патентов, сейчас работает в компании Х. Звучит таинственно, но компания настолько крута, что мы пока не раскроем ее.

Похимичим в ABBYY Lab


image
Корпус Физтех.Цифра, где находятся большая часть лабораторий ФПМИ, включая и ABBYY Lab

Мы в ABBYY уделяем большое внимание направлению исследований и разработок. Более 25% всех затрат на R&D компания инвестирует в исследования в области обработки естественного языка и компьютерного зрения. Это необходимо, чтобы разрабатывать сложные наукоемкие технологии, которые приносят реальную пользу компаниям разных отраслей и людям во всем мире.

Именно поэтому в 2019 году на базе ФПМИ мы создали лабораторию ABBYY Lab. Там студенты и сотрудники МФТИ занимаются передовыми разработками в сфере обработки естественного языка и анализа изображений и исследуют новейшие методы анализа данных.

Какими задачами занимаются сотрудники лаборатории?

  • Распознавание сложных текстов (например, рукописных, текстов в естественной сцене);
  • физика цвета и ее применение в задачах сегментации;
  • синтез реалистичного видео;
  • нетематическая классификация текстов;
  • понимание языка социальных медиа;
  • обнаружение текстовых ориентиров;
  • межмодальные связи;
  • дифференцируемые алгоритмы;
  • автоматизация поиска архитектуры нейронных сетей;
  • обучение на недостаточных данных: без учителя, с частичным привлечением учителя, по нескольким примерам.

Какими проектами занимаются в ABBYY Lab прямо сейчас?

  • Автоматизация поиска архитектуры нейронных сетей в задачах комплексного распознавания текста;
  • иерархические нейронные сети для классификации на большое количество классов;
  • синтез читающего видео-агента заданной стилистики;
  • управление вектором стиля при синтезе обучающей выборки для обучения распознаванию рукописного текста.

Лабораторию возглавляет Александр Жуковский, руководитель Computer Vision Research Group в ABBYY.

Александр: «Несмотря на пандемию, мы выступили на нескольких международных конференциях: 26-ой международной конференции по компьютерной лингвистике и интеллектуальным технологиям "Диалог", а также 14th IAPR International Workshop on Document Analysis Systems и 17th International Conference on Frontiers of Handwriting Recognition – это две конференции про распознавание документов, не столь давно выделенные из основной конференции в области – ICDAR. Мой коллега по ABBYY Lab недавно участвовал в воркшопе по моделированию естественной артикуляции человека по произносимой им речи и тексту – GENEA (Generation and Evaluation of Non-verbal Behaviour for Embodied Agents) Workshop и получил хорошие результаты».



Если у вас остались вопросы о ФПМИ, кафедрах ABBYY и ABBYY Lab, задавайте их в комментариях! А также подписывайтесь на группу ФПМИ в соцсетях и узнавайте самые свежие новости физтех-школы первыми.

Кстати, те, кто закончили ФИВТ, ФУПМ или уже ФПМИ, рассказывайте в комментах, чем вам запомнилась учеба в Физтех-школе и что бы вам хотелось улучшить!