TL;DR: Этой осенью сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.
Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
Word2Vec;
RNN;
CNN;
Transformer.
Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования, генерации, включая само собой всеми любимый машинный перевод. Каждое занятие будет состоять из лекции и семинара. Полный syllabus курса можно посмотреть здесь.
В этом запуске будет новая тема - применение методов NLP в задачам разработки программного обеспечения (NLP4Code, AI4SE). Если вам было интересно, как устроен Github Copilot или OpenAI Codex, то присоединяйтесь.
Также в курсе будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.
Лекции и семинары будут онлайн. Помимо этого мы сделали для части лекций на платформе курса нарезку из роликов по отдельным темам для удобства слушателей. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Список проектов с прошлых запусков выложен вот тут.
Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. Сам курс запускается в этом виде в пятый раз. В других инкарнациях он был уже около десятка раз, так что с одной стороны есть сообщество выпускников, с которыми можно кооперироваться для выполнения проектов, с другой многие (хотя, конечно, не все) острые углы удалось сгладить. Также в этом запуске мы сотрудничаем сразу с тремя вузами: МГТУ им. Баумана, ИТМО и ВШЭ. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.
В этом запуске все общение по курсу будет концентрировать в группе в Telegram.
Лекции будут проходить по средам в 19:10. Ссылка будет в группе курса. Первое занятие - уже в эту среду, 14 сентября!
Надеюсь, я вас заинтересовал, еще раз ссылка на курс.
Комментарии (6)
Wundarshular
13.09.2022 05:29Ссылка в телеграм-канал (вот эта - https://t.me/+AciH2MVMv_RiMGQyi) устарела, говорит телеграм.
madrugado Автор
13.09.2022 08:58в посте дана правильная ссылка: https://t.me/+AciH2MVMv_RiMGQy
на сайте поправим
MyWave
13.09.2022 10:01+2Пытался заехать в NLP по этому курсу. Мне он совершенно не подошёл. Записи, объяснения и контент - сумбурные и непонятные. Простые вещи объясняются долго, а сложные за пол слайда проскакиваются. Я не увидел никакого плана курса и никакой линии повествования. Темы скакали бессвязно. Дропнул после 4 лекции.
Я использовал книгу Natural Language Processing in Action_ Understanding, analyzing, and generating text with Python. Всё понятно и чётко.
madrugado Автор
13.09.2022 14:26у всех свои представления о простых и сложных вещах, если вы более подробно сформулируете, что в первых 4 лекциях объяснено недостаточно хорошо, я буду вам благодарен
sukhe
То есть, можно будет посмотреть в записи? Хочется поучаствовать, но в среду в 19:00 никак не получается :(
madrugado Автор
записи уже есть, можно смотреть их, суть курса не в прослушивании лекций, как таковых, лекции - это способ помочь вам разобраться с инструментами и основными задачами; а свои знания вы сможете применить в проекте - вот для проектов надо участвовать в обсуждениях, задавать вопросы (ну и слушать лекции тоже)