Эта книга позволит программистам, аналитикам данных, статистикам, специалистам по обработке данных и всем остальным применить машинное обучение к решению реальных задач или хотя бы просто понять, что оно собой представляет. Читатели, не прибегая к глубокому теоретическому изучению конкретных алгоритмов, получат практический опыт обработки реальных данных, моделирования, оптимизации и развертки систем машинного обучения. Для тех, кому интересна теория, мы обсуждаем математическую основу машинного обучения, объясняем некоторые алгоритмы и даем ссылки на материалы для дополнительного чтения. Основной акцент делается на практических результатах при решении поставленных задач.
Книга предназначена для тех, кто хочет применять машинное обучение к решению различных задач. В ней описываются и объясняются процессы, алгоритмы и инструменты, относящиеся к основным принципам машинного обучения. Внимание акцентируется не на способах написания популярных алгоритмов, а на их практическом применении. Каждый этап построения и использования моделей машинного обучения иллюстрируется примерами, сложность которых варьируется от простого до среднего уровня.
Структура книги
Часть I «Последовательность действий при машинном обучении» знакомит с пятью этапами основной последовательности машинного обучения:
• В главе 1 «Что такое машинное обучение?» рассказывается, что представляет собой машинное обучение и для чего оно нужно.
• В главе 2 «Реальные данные» подробно рассматриваются характерные стадии подготовки данных для моделей с машинным обучением.
• Глава 3 «Моделирование и прогнозирование» обучает с помощью распространенных алгоритмов и библиотек созданию простых ML-моделей и генерированию прогнозов.
• В главе 4 «Оценка и оптимизация модели» ML-модели подробно рассматриваются с целью оценки и оптимизации их производительности.
• В главе 5 «Основы проектирования признаков» рассказывается о том, как увеличить количество необработанных данных, используя информацию из поставленной перед нами задачи.
В части II «Практическое применение» вводятся техники масштабирования моделей, а также техники извлечения признаков из текста, изображений и временных рядов, увеличивающие эффективность решения многих современных задач с машинным обучением. Эта часть содержит три главы с практическими примерами.
• Глава 6 «Пример: чаевые для таксистов» — первая, полностью посвященная рассмотрению примера. Мы попытаемся предсказать шансы таксиста на получение чаевых.
• Глава 7 «Усовершенствованное проектирование признаков» знакомит с более сложными техниками проектирования признаков, предназначенными для извлечения значений из текстов, изображений и временных рядов.
• В главе 8 «Пример обработки естественного языка» усовершенствованные техники проектирования признаков используются для предсказания тональности рецензий на фильмы.
• Глава 9 «Масштабирование процесса машинного обучения» знакомит с техниками, дающими ML-системам возможность работать с большими объемами данных, обеспечивающими более высокую скорость прогнозирования и уменьшающими время их ожидания.
• В главе 10 «Пример с цифровой рекламой» на большом объеме данных строится модель, предсказывающая вероятность перехода по рекламному баннеру.
Как читать эту книгу
Тех, кто пока не имеет опыта в области машинного обучения, главы с 1-й по 5-ю познакомят с процессами подготовки и исследования данных, проектированием признаков, моделированием и оценкой моделей. В примерах кода на языке Python используются такие популярные библиотеки, как pandas и scikit-learn. Главы с 6-й по 10-ю включают в себя три практических примера машинного обучения наряду с такими продвинутыми темами, как проектирование признаков и оптимизация. Так как основная вычислительная сложность инкапсулирована в библиотеках, приведенные фрагменты кода легко адаптировать к вашим собственным ML-приложениям.
Об авторах
Хенрик Бринк — специалист по обработке и анализу данных и разработчик программного обеспечения, имеющий огромный практический опыт машинного обучения как в области производства, так и в сфере научной деятельности.
Джозеф Ричардс — старший научный сотрудник в области прикладной статистики и предсказательной аналитики. Хенрик и Джозеф совместно основали компанию Wise.io, которая занимается разработкой решений с машинным обучением для промышленности.
Марк Феверолф — основатель и президент компании Numinary Data Science, специализирующейся в области управления данными и предсказательной аналитики. Он работал статистиком и разработчиком аналитических баз данных в области социальных наук, химической инженерии, производительности информационных систем, планирования объема производства, кабельного телевидения и приложений для рекламы в Интернете.
» Более подробно с книгой можно ознакомиться на сайте издательства
» Оглавление
» Отрывок
Для Хаброжителей скидка 25% по купону — Машинное обучение
Комментарии (27)
samodum
06.07.2017 13:53+1Оплатил, купил книгу, а ссылки на скачивание нет!
Почему по почте не пришла ссылка?
Как вообще получить оплаченный товар?samodum
06.07.2017 14:25По телефону издательства (800)500-42-17 никто не отвечает, либо сбрасывают трубку.
Что вообще происходит?samodum
06.07.2017 14:31Надеюсь, что мои улетевшие в трубу 412 руб. были последними деньгами, которые вы получили.
Не рекомендую никому покупать книги у издательства «Питер»
«Почитал», блин, книжку :(
samodum
06.07.2017 14:11+2Ау, «Питер»!
Почему в 2017-м году приходится оплаченный товар на вашем сайте искать через помощь на хабре?
Я оплатил, но ничего не получил, в обратной связи обращения уходят в никуда, нет истории переписки.
Сильно попахивает лохотроном.
У вас сайт фрилансеры на коленке делали что ли?
Чтобы я ещё раз у вас что-то заказал? Никогда!apelsyn
06.07.2017 15:06+3Купил у них уже около 5 книг. Мне все ссылки на почту приходили, возможно у них проблема с отправкой почты на Ваш ящик. У меня ящик на gmail, с ним проблем нету.
Тут не "лохотрон" а идеализированное представление о доставке контента через электронную почту. :)
samodum
06.07.2017 15:42-2А я больше ни одной книги у них не куплю. Это была первая «покупка» и последняя.
Заметьте, даже здесь они не отвечают.
Как и на телефоны, по обратной связи и. т.д.
Поэтому при первой же проблеме вы ничего решить не сможете.
Задумайтесь — а оно вам надо, рисковать так?
WRP
06.07.2017 16:10Попробуйте поискать в спаме. Бывает, что письмо попадает в нежелательный список. Если почтовый адрес правильно указали, то только в этом проблема. «Питер» ни разу не обманывал меня, да и смысла в этом не вижу абсолютно.
CheY
06.07.2017 16:10+2Купил, бегло пролистал и начал читать. Если вы хотите увидеть in-depth разбор чего-то про ML, то эта книга явно плохой выбор. Здесь всё очень поверхностно с упором на то, «что писать, куда смотреть», и с желанием охватить побольше тем.
И ещё хотелось бы, чтобы вы как-то поменяли схему работы с курьерской доставкой в Москву. Дважды заказывал книги и дважды курьер приезжал совершенно без предупреждений. Один раз ему повезло застать меня дома. Второй раз — нет, и пришлось переназначать встречу. Крайне неудобно.ph_piter
06.07.2017 16:12Спасибо, написали в личку для уточнения.
Roms
06.07.2017 20:34А может Вы всё же отправляете и за границу, в страны Европа? Иначе придётся заказать через какой-нибудь интернет магазин и соответственно без скидки.
ph_piter
06.07.2017 20:35Отправляем, любой почтовой службой, правда доставка очень дорогая будет. Напишите на сайте или сюда в личку город. Рассчитаем.
odysset
06.07.2017 16:13+1Всегда было интересно, почему именно язык питон ассоциируется с машинным обучением, что в этом языке такого магического? (опыта программирования на питоне не имею)
kdenisk
06.07.2017 17:201. Питон за счёт нестрогой типизации и многих других вольностей позволяет очень быстро готовить данные, а правильно препарированные данные — немалая часть успеха в ML.
2. Есть такая штука, как IPython Notebook — интерактивная среда, где можно очень быстро экспериментировать без необходимости компиляции программы каждый раз.
Эти два фактора и сделали Питон де-факто стандартом для аналитика данных. Дальше всё обросло зрелыми и быстрыми библиотеками для машинного обучения и сделало Python лидером в ML.odysset
07.07.2017 11:14А что насчет lua? Ведь он тоже нестрого типизированный язык. Так же, на сколько я понял — самый быстрый скриптовой язык. Тогда почему именно Питон? Не считая вашу штуку, как IPython Notebook, не особо понятен хайп, сложивший вокруг него.
kdenisk
07.07.2017 11:38У них разная специализация. В базовый комплект Lua не входит почти ничего, т.к. он задумывался как встраиваемый язык с тем, чтобы быстро накидать алгоритм и дёрнуть внешний API. У Python нет таких ограничений — в комплекте поставки очень богатая стандартная библиотека для решения всех «бытовых» задач.
И, конечно, 1-based индексация массивов это какой-то ад.
>> не особо понятен хайп, сложивший вокруг него
Когда-то был сделан выбор в пользу Python, и он оброс таким количеством библиотек для ML, что альтернативы на сегодняшний день просто нет. Можно, конечно, привести в пример R, но он уже уступает по популярности, особенно с популяризацией нейронок и библиотек под них.
mike_y_k
07.07.2017 11:27Проблем с покупкой электронной версиии не обнаружил ;).
Думаю и hardcopy не вызовет проблем — в этой части там нет разницы, только доставка.
Письмо со ссылкой благополучно пришло и ссылка работает.
Теперь увы немного дегтя :(.
По сайту:
— поле ФИО неплохо бы разделить на 2/3 отдельные части и таки определить что требуется (ФИО — в строгом смысле это инициалы);
— уже немного раздражает неспособность разработчика (возможно по нежеланию или отсутствию времени/мотивации) переключать клавиатуру в полях для мобильных устройств — для e-mail есть более удобный формат клавиатуры;
— доставка заказа в формате .zip наверное экономит место на сервере издательства (и работу разработчика), но у покупателя вызывает «некоторые» проблемы после получения;
— ограничение в 30 дней выглядит странно, было бы разумнее таки хранить информацию в учётной записи. Там же можно было предоставлять доступ к 3-м вариантам для скачивания: zip/PDF/ePub;
— два предыдущих пункта запросто решаются на сервере при любой форме хранения ;).
Как-то так. Пошёл читать. По содержимому уже отдельно — нужно таки время на сам процесс и переваривание информации.
PS. Изначальный комментарий почему-то не был одобрен, это его немного исправленная и дополненная версия.
В ePub много пустых страниц (в конце каждого раздела первого уровня) и странное отображение информации в таблицах, несколько затрудняющее чтение.
Сама книга (по первой главе) хорошо написана и качественно переведена.
CodeViking
Было бы интересно прочесть эту книгу. Очень хочу научиться применять нейронные сети и машинное обучение для разного рода задач как в стартапах так и в быту.
kirill3333
в быту?
CodeViking
Я об «умном доме» говорил. Естественно целый дом делать «умным» я не хочу, но вот истории подобны этой — вдохновляют и каждый наверняка найдёт, что бы он автоматизировал в своём быту (необязательно дома кстати).