«Роман с Data Science. Как монетизировать большие данные», Роман Зыков
Эта достаточно лёгкая книга, зайдёт в перерывах между чтением жесткого технического чтива или написания кода.
![](https://habrastorage.org/getpro/habr/upload_files/441/41b/b67/44141bb67cfefdddfa7f845aaca8688d.png)
Заголовок явно намекает, что в книге будет не такой большой упор на применяемые технологии и задачи, ведь непосредственно к данным мы подбираемся где-то к главе пятой. Здесь больше упора на интересы бизнеса, менеджерские процессы, работу с командой или собственное развитие.
![](https://habrastorage.org/getpro/habr/upload_files/90b/4ed/d82/90b4edd82e584ab21e0d2fc6c590df30.png)
Но не думайте, что в книге только «мотивационная и менеджерская вода». Совсем нет. Например, вот иллюстрация из главы про MapReduce.
![](https://habrastorage.org/getpro/habr/upload_files/a48/cab/f21/a48cabf2191b015acc2705cfa174c1e1.png)
«Считается, что нужно потратить 10 000 часов, чтобы стать очень хорошим специалистом в своей области. Популярное заблуждение. Можно и сто тысяч часов потратить и не стать высококвалифицированным профессионалом. Важно как именно время потрачено, а количество вторично»
«Роман с Data Science. Как монетизировать большие данные», Роман Зыков
На роман вы потратите гораздо меньше времени, но оно уйдёт не зря.
![](https://habrastorage.org/getpro/habr/upload_files/031/958/87f/03195887f26c7e1d8ef1a6554778a50e.png)
Безгин Алексей
Стажер, Лаборатория машинного обучения Альфа-Банка
The Signal and the Noise: Why So Many Predictions Fail, Nate Silver
На русском называется «Сигнал и Шум: почему многие предсказания сбываются, а другие нет»
![](https://habrastorage.org/getpro/habr/upload_files/699/55a/4e8/69955a4e8f984cd38b0f5b0181203b97.png)
Книга написана достаточно просто и понятно. Автор рассказывает о своих исследованиях в области статистики и теории вероятности, которые охватывают различные области человеческой деятельности: спорт, политику и даже прогноз погоды.
![](https://habrastorage.org/getpro/habr/upload_files/dc3/5a5/10e/dc35a510e24c13d779a393de355520d3.jpeg)
Алексей Фирстов
Специалист, Лаборатория машинного обучения Альфа-Банка
«В книге Нейта Сильвера подробно рассказывается о теоретических предпосылках, которые позволили менеджеру “Атлетик” без достаточного финансирования сколотить команду мирового уровня, пользуясь только математикой и любовью к бейсболу. Об этом потом сняли замечательный фильм “Человек, которые изменил все” с Брэдом Питтом»
Написано просто и понятно, но приготовьтесь к долгому и обстоятельному погружению — примерно с 15 века:
«По сути, революция в области информационных технологий совершилась благодаря печатному прессу, а вовсе не микрочипу. Изобретение Иоганна Гутенберга, сделанное им в 1440 г., позволило информации стать доступной широким массам людей, а возникший в результате этого взрыв новых идей привел к неожиданным последствиям и непредсказуемым эффектам»
«Сигнал и Шум: почему многие предсказания сбываются, а другие нет», Нэйт Сильвер.
Никто не ожидал, но вот рандомный факт о книге. Ещё вы узнаете, почему полвека назад прогноз дождя был бинарным событием (либо да, либо нет), а сейчас на фразу «Завтра будет дождь с вероятность 78%» вы даже внимания не обратите. Уже так привычно.
Machine Learning Podcast
Делимся ссылкой на Яндекс.Музыку, но на других платформах подкаст тоже есть.
![](https://habrastorage.org/getpro/habr/upload_files/45c/c53/349/45cc5334923cd1270ce99d146f807b0a.png)
Machine Learning Podcast позиционирует себя как хаб-знаний, созданный «неспециалистом для неспециалистов». Однако, его можно порекомендовать для накопления технологической насмотренности. Пока едете на учёбу, на работу, в гости или в аэропорт можно послушать про SOTA-подходы к решению многих задач, крутые архитектуры или интервью с профессионалами своего дела, вроде Юры Яровикова или Валеры Бабушкина.
![](https://habrastorage.org/getpro/habr/upload_files/b26/253/bc2/b26253bc256fd483377f97330b330951.png)
Безгин Алексей
Стажер, Лаборатория машинного обучения Альфа-Банка
«Мой любимый эпизод — выпуск с Иваном Ямщиковым (Yandex & HSE) про архитектуру автоэнкодеров. Некоторые серии подкаста достаточно длинные, но можно слушать их не только в дороге, но и занимаясь делами по дому, на пробежке и в целом везде, где угодно»
SuperDataScience
Раз уж коснулись подкастов, то вот еще один — SuperDataScience. Над названием, видимо, долго не думали:)
![](https://habrastorage.org/getpro/habr/upload_files/960/64c/fbc/96064cfbc7dafcc03ffe1a832cbb72cd.png)
![](https://habrastorage.org/getpro/habr/upload_files/72e/3f9/4d5/72e3f94d5aed35d9b6f145c3b6e01b81.jpeg)
Алексей Фирстов
Специалист, Лаборатория машинного обучения Альфа-Банка
«Крутой подкаст с очень крутыми гостями, выходит на английском языке. В подкасте гости из топовых компаний рассказывают о своих успехах и неудачах, о том, как они находят по 40 часов в сутках и конечно делятся интересными инсайтами из сферы ИИ. Очень хорошо заходит по дороге на работу, при прогулке и поездке в метро???? Уровень гостей, как правило, достаточно высокий, поэтому и английский там очень понятный, без проглатывания кучи слов и звуков, рекомендую»
Курс Deep Learning For Computer Vision EECS 498.008 / 598.008
Подкасты были, теперь курс.
![](https://habrastorage.org/getpro/habr/upload_files/a66/06e/0b7/a6606e0b72abc7bc926cee47c83f9f43.png)
При этом он универсальный: если вы только начинаете изучать Deep Learning или думаете что уже все понимаете в деталях — изучите этот курс, вас ждут большие открытия.
![](https://habrastorage.org/getpro/habr/upload_files/2bf/4d1/75d/2bf4d175de2cb9facad84acb1ea1adb7.jpeg)
Алексей Фирстов
Специалист, Лаборатория машинного обучения Альфа-Банка
«За 10 лет образования в ВУЗе я видел много хороших лекторов, но Джастин Джонсон (да, он ушел из Стенфорда и больше не преподает cs231n) это следующий уровень, а его презентации к лекциям помогут понять даже самые сложные вещи. Несмотря на название, это больше про general dl, тут расскажут про все архитектуры, техники обучения и дадут ссылки на статьи мирового класса в DL.
А если Вы думаете, что уже большой профессионал — попробуйте порешать их домашки, я думаю мало кто сходу сможет написать и простенький AlexNet, без импорта TF или PyTorch, прописывая forward-backward самостоятельно (да, придется вспомнить математику)»
Программу курса 2022 года можно посмотреть на этой странице. Если сомневаетесь — вот страница с программой, материалами лекций и слайдами еще первого курса 2015-го года.
Deep Learning, Ian Goodfellow and Yoshua Bengio and Aaron Courville
Закончим книгой. Если будете читать её одновременно с предыдущим курсом — получится мощное комбо.
![](https://habrastorage.org/getpro/habr/upload_files/6eb/cdd/9f7/6ebcdd9f728e3db54ab0aad15a5ee065.png)
Написанная в период бума глубокого обучения отцами современного ИИ, эта классическая книга успела возрастить уже не одно поколение дата сайентистов. Не стоит переживать из-за ее дедушкинскинского (по стандартам ДЛ) возраста: книга сугубо теоретическая, и содержит детально проработанные описания фундаментальных техник глубокого обучения, которые повсеместно используются и в сегодняшней практике, а также большое количество важных сопроводительных тем, таких как оптимизация и дизайн систем.
Есть как в печатном вариант, так и в бесплатном виде на официальном сайте.
![](https://habrastorage.org/getpro/habr/upload_files/136/c76/0c0/136c760c0c93e68ba850f027c25b01d9.png)
Несмотря на большую глубину материала, он все равно остается лёгким для чтения, однако от читателя требуется некоторая степень математической зрелости и базовые знания в классическом машинном обучении.
![Например, чтобы вспомнить линейную алгебру или теорию вероятности из первой главы. Например, чтобы вспомнить линейную алгебру или теорию вероятности из первой главы.](https://habrastorage.org/getpro/habr/upload_files/078/c2f/fd4/078c2ffd4b9855873b0aeb67bb160a0f.png)
Помогают в чтении примеры, графики и схемы.
![](https://habrastorage.org/getpro/habr/upload_files/d7c/766/f80/d7c766f80285bb75f90a89bfef05ef80.jpeg)
![](https://habrastorage.org/getpro/habr/upload_files/a42/664/66e/a4266466e48df95a45dc562b25ec0423.jpeg)
Олег Сидоршин
Стажер, Лаборатория машинного обучения Альфа-Банка
«Учитывая теоретический характер книги, я советую использовать её вместе с практическими курсами для углубления понимания применяемых техник. Также эта книга сможет стать отличным первым путешествием в исследовательскую сторону МЛ!
Из недостатков стоит отметить большую любовь авторов к статистике. Из-за этого регулярно происходят попытки сложно и долго впихнуть в статистический фреймворк техники, которые обычно через него не рассматриваются. Это только запутывает читателя: видим статистику — значит читаем осторожно :)»
На этом всё — поделитесь в комментариях, было ли полезно, и чем ещё можно было бы дополнить наш список:)
Рекомендуем почитать
Нейросетевой подход к кредитному скорингу на данных кредитных историй
Как и зачем мы начали искать бизнес-инсайты в отзывах клиентов с помощью машинного обучения
Как я участвовал в соревновании по машинному обучению и занял второе место (и почему не первое)
Как мы заняли первое место в хакатоне ВК «Машинное обучение на графах», где не было графов
Как мы искали взаимосвязь между оценкой SUS и эмоциональным откликом