Привет, Хабр! Это Миша Степнов, руководитель центра R&D Big Data в МТС Диджитал. Машинное обучение и технологии искусственного интеллекта постоянно развиваются — так что специалистам этой сферы приходится за ними поспевать. Держать руку на пульсе помогают в том числе книги. Сегодня поделюсь подборкой из шести книг по машинному обучению, которые будут интересны начинающим (и не только) специалистам.
Грокаем машинное обучение
Автор: Луис Серрано
Автор рассказывает, что такое машинное обучение и показывает его на примере выявления спама и распознавания изображений. Язык программирования — Python. Тут же раскрываются разные методы машинного обучения, освоить которые можно даже со школьным уровнем математики.
Плюсы книги:
изложена доступно, подходит начинающим;
автор избегает частого использования сложных терминов;
суть алгоритмов объясняется пошагово;
много примеров и иллюстраций.
Из недостатков можно отметить, что некоторые читатели жалуются на ошибки перевода.
«Грокаем машинное обучение» в первую очередь рекомендую прочитать начинающим специалистам. Хотя ее могут использовать и более опытные представители профессии — например, чтобы освежить в памяти какие-то важные моменты по машинному обучению.
Машинное обучение с PyTorch и Scikit-Learn
Авторы: Себастьян Рашка, Юси Лю, Вахид Мирджалили
Машинное обучение с PyTorch и Scikit-Learn — самая объемная из когда-либо издававшихся книг по ML и DL. Сами авторы позиционируют ее в качестве универсального пособия, которое подойдет как начинающим дата-сайентистам, включая слушателей ИТ-курсов, так и опытным экспертам в Machine Learning & Deep Learning.
Авторы рассказывают об основах машинного обучения, обработке данных, оценке моделей, классификации и ансамблевом обучении. Раскрываются основы создания нейросетей, причем с использованием таких фреймворков, как PyTorch. В книге расматриваются CNN, RNN, трансформеры, GAN и GNN, даётся понимание прогнозирования непрерывных целевых результатов с помощью регрессионного анализа и особенностей текстовых данных и данных из социальных сетей с помощью тонального анализа.
Плюсы книги:
разбираются темы, которые будут полезны новичкам (например, основы ML) и более опытным специалистам;
постепенно авторы переходят от основ к передовым методам ML и DL;
рассказывается о современных инструментах: трансформерах, GAN, GNN и так далее;
указан доступ к GitHub-репозиторию и дополнительным ресурсам.
Недостатки:
большой объем;
сложные термины, которые могут быть непонятны начинающим специалистам.
Подробный обзор тоже есть на Хабре
Математика в машинном обучении
Авторы: Дайзенрот Марк Питер, Фейзал А. Альдо, Он Чен Сунь
В книге читателя знакомят с базовыми математическими концепциями, которые будут полезны любому специалисту. Потом плавно переводят к четырем основным методам МО: линейной регрессии, методу главных компонент, гауссову моделированию и методу опорных векторов.
Чтобы понять эту книгу, читатель должен иметь представление о производных и интегралах, геометрических двумерных и трехмерных векторах.
Достоинства — подходит для изучения математического аппарата в машинном обучении, можно узнать о математических концепциях и углубить свои математические знания. Недостатки — встречаются опечатки, а материал изложен довольно сжато.
Хорошая книга для тех, кто хочет глубже изучить математику, освоив инструментарий, который нужен для работы в отрасли машинного обучения.
Машинное обучение. Портфолио реальных проектов
Автор: Алексей Григорьев
В книге приводятся практические сценарии с подробным объяснением результатов анализа поведения клиентов, прогнозирования цен и оценки рисков бизнеса. Предназначена в основном для новичков.
«Машинное обучение» построено на основе реальных кейсов разных компаний и предпринимателей. Авторы помогают читателю разбираться в прогнозировании цен на автомобили и предсказывать отток клиентов. А еще читателя научат развертывать приложения с Kubernetes и Kubeflow.
Достоинства книги — авторы умело рассказывают просто о сложном, есть много примеров, разбор которых полезен для начинающего специалиста. Но анализировать и разбирать все эти кейсы придется долго.
System Design. Машинное обучение. Подготовка к сложному интервью
Автор: Алекс Сюй
Это практическое пособие по подготовке к собеседованиям по проектированию систем машинного обучения. Предназначено для программистов уровня Junior+ и выше. Авторы приводят примеры реальных вопросов с технических интервью и объясняют, почему интервьюеры все это спрашивают. Всего в книге 10 вопросов собеседований с подробными ответами. Заодно читателя учат решать сложные задачи машинного обучения.
Книга позиционируется как источник информации для всех, кто интересуется проектированием систем МО, будь то новички или опытные инженеры. Основной упор именно на интервью, это не пособие по самому машинному обучению.
Плюс книги — подробные примеры реальных вопросов с собеседований по МО. Это поможет читателю подготовиться к техническому интервью. Недостаток — обилие сложных тем, так что книга может не подойти начинающему разработчику. Но для опытных специалистов этот недостаток, наоборот, будет плюсом.
Итак, пять книг перечислил. Бонусом ловите шестую книгу. Ее нельзя обойти стороной, ведь это главный учебник по нейросетям в России. А его основной автор — не только крутой специалист, но и прекрасный человек.
Глубокое обучение. Погружение в мир нейронных сетей
Авторы: Сергей Николенко, Артур Кадурин, Екатерина Архангельская
Как вы уже поняли, я большой фанат Сергея Николенко. Из всего сообщества российских ученых в области ИИ он отличается огромным дружелюбием и общительностью. А его книга — основа основ для сотен специалистов в области глубокого обучения. В ней описывается история глубокого обучения и его основные идеи. Авторы показывают, как это все работает в современном мире и какие у направления есть перспективы.
Всего в книге три подраздела:
Как обучать нейронные сети.
Основные архитектуры.
Новые архитектуры и применения.
А вот и примеры тем, которые здесь разбираются:
Преимущество книги в том, что несмотря на сложные темы она легко читается. Здесь нет огромного количества кода, зато много понятных объяснений. К каждой главе после подзаголовка есть тезисы: о чем именно вы тут можете прочитать. Так что найти информацию по узкой теме довольно просто, листать от корки до корки не придется:
На сегодня все. Если у вас есть собственные фавориты среди книг по машинному обучению и связанным темам, рассказывайте о них в комментариях.
o5boleg
Недавно вышел хороший двухтомник Сергея Маркова - Охота на электроовец, скачать https://markoff.science/#book