«Роман с Data Science. Как монетизировать большие данные», Роман Зыков
Эта достаточно лёгкая книга, зайдёт в перерывах между чтением жесткого технического чтива или написания кода.
Заголовок явно намекает, что в книге будет не такой большой упор на применяемые технологии и задачи, ведь непосредственно к данным мы подбираемся где-то к главе пятой. Здесь больше упора на интересы бизнеса, менеджерские процессы, работу с командой или собственное развитие.
Но не думайте, что в книге только «мотивационная и менеджерская вода». Совсем нет. Например, вот иллюстрация из главы про MapReduce.
«Считается, что нужно потратить 10 000 часов, чтобы стать очень хорошим специалистом в своей области. Популярное заблуждение. Можно и сто тысяч часов потратить и не стать высококвалифицированным профессионалом. Важно как именно время потрачено, а количество вторично»
«Роман с Data Science. Как монетизировать большие данные», Роман Зыков
На роман вы потратите гораздо меньше времени, но оно уйдёт не зря.
Безгин Алексей
Стажер, Лаборатория машинного обучения Альфа-Банка
The Signal and the Noise: Why So Many Predictions Fail, Nate Silver
На русском называется «Сигнал и Шум: почему многие предсказания сбываются, а другие нет»
Книга написана достаточно просто и понятно. Автор рассказывает о своих исследованиях в области статистики и теории вероятности, которые охватывают различные области человеческой деятельности: спорт, политику и даже прогноз погоды.
Алексей Фирстов
Специалист, Лаборатория машинного обучения Альфа-Банка
«В книге Нейта Сильвера подробно рассказывается о теоретических предпосылках, которые позволили менеджеру “Атлетик” без достаточного финансирования сколотить команду мирового уровня, пользуясь только математикой и любовью к бейсболу. Об этом потом сняли замечательный фильм “Человек, которые изменил все” с Брэдом Питтом»
Написано просто и понятно, но приготовьтесь к долгому и обстоятельному погружению — примерно с 15 века:
«По сути, революция в области информационных технологий совершилась благодаря печатному прессу, а вовсе не микрочипу. Изобретение Иоганна Гутенберга, сделанное им в 1440 г., позволило информации стать доступной широким массам людей, а возникший в результате этого взрыв новых идей привел к неожиданным последствиям и непредсказуемым эффектам»
«Сигнал и Шум: почему многие предсказания сбываются, а другие нет», Нэйт Сильвер.
Никто не ожидал, но вот рандомный факт о книге. Ещё вы узнаете, почему полвека назад прогноз дождя был бинарным событием (либо да, либо нет), а сейчас на фразу «Завтра будет дождь с вероятность 78%» вы даже внимания не обратите. Уже так привычно.
Machine Learning Podcast
Делимся ссылкой на Яндекс.Музыку, но на других платформах подкаст тоже есть.
Machine Learning Podcast позиционирует себя как хаб-знаний, созданный «неспециалистом для неспециалистов». Однако, его можно порекомендовать для накопления технологической насмотренности. Пока едете на учёбу, на работу, в гости или в аэропорт можно послушать про SOTA-подходы к решению многих задач, крутые архитектуры или интервью с профессионалами своего дела, вроде Юры Яровикова или Валеры Бабушкина.
Безгин Алексей
Стажер, Лаборатория машинного обучения Альфа-Банка
«Мой любимый эпизод — выпуск с Иваном Ямщиковым (Yandex & HSE) про архитектуру автоэнкодеров. Некоторые серии подкаста достаточно длинные, но можно слушать их не только в дороге, но и занимаясь делами по дому, на пробежке и в целом везде, где угодно»
SuperDataScience
Раз уж коснулись подкастов, то вот еще один — SuperDataScience. Над названием, видимо, долго не думали:)
Алексей Фирстов
Специалист, Лаборатория машинного обучения Альфа-Банка
«Крутой подкаст с очень крутыми гостями, выходит на английском языке. В подкасте гости из топовых компаний рассказывают о своих успехах и неудачах, о том, как они находят по 40 часов в сутках и конечно делятся интересными инсайтами из сферы ИИ. Очень хорошо заходит по дороге на работу, при прогулке и поездке в метро???? Уровень гостей, как правило, достаточно высокий, поэтому и английский там очень понятный, без проглатывания кучи слов и звуков, рекомендую»
Курс Deep Learning For Computer Vision EECS 498.008 / 598.008
Подкасты были, теперь курс.
При этом он универсальный: если вы только начинаете изучать Deep Learning или думаете что уже все понимаете в деталях — изучите этот курс, вас ждут большие открытия.
Алексей Фирстов
Специалист, Лаборатория машинного обучения Альфа-Банка
«За 10 лет образования в ВУЗе я видел много хороших лекторов, но Джастин Джонсон (да, он ушел из Стенфорда и больше не преподает cs231n) это следующий уровень, а его презентации к лекциям помогут понять даже самые сложные вещи. Несмотря на название, это больше про general dl, тут расскажут про все архитектуры, техники обучения и дадут ссылки на статьи мирового класса в DL.
А если Вы думаете, что уже большой профессионал — попробуйте порешать их домашки, я думаю мало кто сходу сможет написать и простенький AlexNet, без импорта TF или PyTorch, прописывая forward-backward самостоятельно (да, придется вспомнить математику)»
Программу курса 2022 года можно посмотреть на этой странице. Если сомневаетесь — вот страница с программой, материалами лекций и слайдами еще первого курса 2015-го года.
Deep Learning, Ian Goodfellow and Yoshua Bengio and Aaron Courville
Закончим книгой. Если будете читать её одновременно с предыдущим курсом — получится мощное комбо.
Написанная в период бума глубокого обучения отцами современного ИИ, эта классическая книга успела возрастить уже не одно поколение дата сайентистов. Не стоит переживать из-за ее дедушкинскинского (по стандартам ДЛ) возраста: книга сугубо теоретическая, и содержит детально проработанные описания фундаментальных техник глубокого обучения, которые повсеместно используются и в сегодняшней практике, а также большое количество важных сопроводительных тем, таких как оптимизация и дизайн систем.
Есть как в печатном вариант, так и в бесплатном виде на официальном сайте.
Несмотря на большую глубину материала, он все равно остается лёгким для чтения, однако от читателя требуется некоторая степень математической зрелости и базовые знания в классическом машинном обучении.
Помогают в чтении примеры, графики и схемы.
Олег Сидоршин
Стажер, Лаборатория машинного обучения Альфа-Банка
«Учитывая теоретический характер книги, я советую использовать её вместе с практическими курсами для углубления понимания применяемых техник. Также эта книга сможет стать отличным первым путешествием в исследовательскую сторону МЛ!
Из недостатков стоит отметить большую любовь авторов к статистике. Из-за этого регулярно происходят попытки сложно и долго впихнуть в статистический фреймворк техники, которые обычно через него не рассматриваются. Это только запутывает читателя: видим статистику — значит читаем осторожно :)»
На этом всё — поделитесь в комментариях, было ли полезно, и чем ещё можно было бы дополнить наш список:)
Рекомендуем почитать
Нейросетевой подход к кредитному скорингу на данных кредитных историй
Как и зачем мы начали искать бизнес-инсайты в отзывах клиентов с помощью машинного обучения
Как я участвовал в соревновании по машинному обучению и занял второе место (и почему не первое)
Как мы заняли первое место в хакатоне ВК «Машинное обучение на графах», где не было графов
Как мы искали взаимосвязь между оценкой SUS и эмоциональным откликом