image Привет, Хаброжители к нам из типография наконец-то пришла новинка от Хенрика Бринка, Джозефа Ричардса и Марка Февероволофа.

Эта книга позволит программистам, аналитикам данных, статистикам, специалистам по обработке данных и всем остальным применить машинное обучение к решению реальных задач или хотя бы просто понять, что оно собой представляет. Читатели, не прибегая к глубокому теоретическому изучению конкретных алгоритмов, получат практический опыт обработки реальных данных, моделирования, оптимизации и развертки систем машинного обучения. Для тех, кому интересна теория, мы обсуждаем математическую основу машинного обучения, объясняем некоторые алгоритмы и даем ссылки на материалы для дополнительного чтения. Основной акцент делается на практических результатах при решении поставленных задач.


Книга предназначена для тех, кто хочет применять машинное обучение к решению различных задач. В ней описываются и объясняются процессы, алгоритмы и инструменты, относящиеся к основным принципам машинного обучения. Внимание акцентируется не на способах написания популярных алгоритмов, а на их практическом применении. Каждый этап построения и использования моделей машинного обучения иллюстрируется примерами, сложность которых варьируется от простого до среднего уровня.

Структура книги


Часть I «Последовательность действий при машинном обучении» знакомит с пятью этапами основной последовательности машинного обучения:

• В главе 1 «Что такое машинное обучение?» рассказывается, что представляет собой машинное обучение и для чего оно нужно.

• В главе 2 «Реальные данные» подробно рассматриваются характерные стадии подготовки данных для моделей с машинным обучением.

• Глава 3 «Моделирование и прогнозирование» обучает с помощью распространенных алгоритмов и библиотек созданию простых ML-моделей и генерированию прогнозов.

• В главе 4 «Оценка и оптимизация модели» ML-модели подробно рассматриваются с целью оценки и оптимизации их производительности.

• В главе 5 «Основы проектирования признаков» рассказывается о том, как увеличить количество необработанных данных, используя информацию из поставленной перед нами задачи.

В части II «Практическое применение» вводятся техники масштабирования моделей, а также техники извлечения признаков из текста, изображений и временных рядов, увеличивающие эффективность решения многих современных задач с машинным обучением. Эта часть содержит три главы с практическими примерами.

• Глава 6 «Пример: чаевые для таксистов» — первая, полностью посвященная рассмотрению примера. Мы попытаемся предсказать шансы таксиста на получение чаевых.

• Глава 7 «Усовершенствованное проектирование признаков» знакомит с более сложными техниками проектирования признаков, предназначенными для извлечения значений из текстов, изображений и временных рядов.

• В главе 8 «Пример обработки естественного языка» усовершенствованные техники проектирования признаков используются для предсказания тональности рецензий на фильмы.

• Глава 9 «Масштабирование процесса машинного обучения» знакомит с техниками, дающими ML-системам возможность работать с большими объемами данных, обеспечивающими более высокую скорость прогнозирования и уменьшающими время их ожидания.

• В главе 10 «Пример с цифровой рекламой» на большом объеме данных строится модель, предсказывающая вероятность перехода по рекламному баннеру.

Как читать эту книгу


Тех, кто пока не имеет опыта в области машинного обучения, главы с 1-й по 5-ю познакомят с процессами подготовки и исследования данных, проектированием признаков, моделированием и оценкой моделей. В примерах кода на языке Python используются такие популярные библиотеки, как pandas и scikit-learn. Главы с 6-й по 10-ю включают в себя три практических примера машинного обучения наряду с такими продвинутыми темами, как проектирование признаков и оптимизация. Так как основная вычислительная сложность инкапсулирована в библиотеках, приведенные фрагменты кода легко адаптировать к вашим собственным ML-приложениям.

Об авторах


Хенрик Бринк — специалист по обработке и анализу данных и разработчик программного обеспечения, имеющий огромный практический опыт машинного обучения как в области производства, так и в сфере научной деятельности.

Джозеф Ричардс — старший научный сотрудник в области прикладной статистики и предсказательной аналитики. Хенрик и Джозеф совместно основали компанию Wise.io, которая занимается разработкой решений с машинным обучением для промышленности.

Марк Феверолф — основатель и президент компании Numinary Data Science, специализирующейся в области управления данными и предсказательной аналитики. Он работал статистиком и разработчиком аналитических баз данных в области социальных наук, химической инженерии, производительности информационных систем, планирования объема производства, кабельного телевидения и приложений для рекламы в Интернете.

» Более подробно с книгой можно ознакомиться на сайте издательства
» Оглавление
» Отрывок

Для Хаброжителей скидка 25% по купону — Машинное обучение
Поделиться с друзьями
-->

Комментарии (27)


  1. CodeViking
    05.07.2017 20:59
    +3

    Было бы интересно прочесть эту книгу. Очень хочу научиться применять нейронные сети и машинное обучение для разного рода задач как в стартапах так и в быту.


    1. kirill3333
      06.07.2017 14:13

      в быту?


      1. CodeViking
        06.07.2017 14:29

        Я об «умном доме» говорил. Естественно целый дом делать «умным» я не хочу, но вот истории подобны этой — вдохновляют и каждый наверняка найдёт, что бы он автоматизировал в своём быту (необязательно дома кстати).


  1. iogurt89
    05.07.2017 21:29

    Уже купил.


  1. arvitaly
    06.07.2017 01:51
    +2

    Сделал заказ, где скачать так и не нашел, написал в поддержку, в почте ссылка на заказ есть, но в личном кабинете заказов нет. Просьба сделать сайт человеческим.


    1. rotor
      06.07.2017 13:26

      Да там вcё не очевидно сделано. Мне в итоге прямо на почту ссылка пришла.


  1. sefus
    06.07.2017 10:42
    +6

    Хотел как-то купить книгу, но не понял, зачем вам мой номер телефона?


    1. samodum
      06.07.2017 14:59

      спам рассылать


  1. samodum
    06.07.2017 13:53
    +1

    Оплатил, купил книгу, а ссылки на скачивание нет!
    Почему по почте не пришла ссылка?
    Как вообще получить оплаченный товар?


    1. samodum
      06.07.2017 14:25

      По телефону издательства (800)500-42-17 никто не отвечает, либо сбрасывают трубку.
      Что вообще происходит?


      1. samodum
        06.07.2017 14:31

        Надеюсь, что мои улетевшие в трубу 412 руб. были последними деньгами, которые вы получили.
        Не рекомендую никому покупать книги у издательства «Питер»
        «Почитал», блин, книжку :(


  1. samodum
    06.07.2017 14:11
    +2

    Ау, «Питер»!
    Почему в 2017-м году приходится оплаченный товар на вашем сайте искать через помощь на хабре?
    Я оплатил, но ничего не получил, в обратной связи обращения уходят в никуда, нет истории переписки.
    Сильно попахивает лохотроном.
    У вас сайт фрилансеры на коленке делали что ли?
    Чтобы я ещё раз у вас что-то заказал? Никогда!


    1. apelsyn
      06.07.2017 15:06
      +3

      Купил у них уже около 5 книг. Мне все ссылки на почту приходили, возможно у них проблема с отправкой почты на Ваш ящик. У меня ящик на gmail, с ним проблем нету.


      Тут не "лохотрон" а идеализированное представление о доставке контента через электронную почту. :)


      1. samodum
        06.07.2017 15:42
        -2

        А я больше ни одной книги у них не куплю. Это была первая «покупка» и последняя.
        Заметьте, даже здесь они не отвечают.
        Как и на телефоны, по обратной связи и. т.д.
        Поэтому при первой же проблеме вы ничего решить не сможете.
        Задумайтесь — а оно вам надо, рисковать так?


        1. samodum
          06.07.2017 15:57
          -2

          Вот, дозвонился по вышеуказанному номеру телефона.
          Проблему решили, книгу получил.


          1. BelBES
            06.07.2017 16:15
            +3

            И стоило устраивать истерику в коментариях, когда вашу проблему решили за 2 часа? :-)
            Не быстро, конечно, но все равно довольно неплохо для интернет торговли...


    1. WRP
      06.07.2017 16:10

      Попробуйте поискать в спаме. Бывает, что письмо попадает в нежелательный список. Если почтовый адрес правильно указали, то только в этом проблема. «Питер» ни разу не обманывал меня, да и смысла в этом не вижу абсолютно.


  1. CheY
    06.07.2017 16:10
    +2

    Купил, бегло пролистал и начал читать. Если вы хотите увидеть in-depth разбор чего-то про ML, то эта книга явно плохой выбор. Здесь всё очень поверхностно с упором на то, «что писать, куда смотреть», и с желанием охватить побольше тем.

    И ещё хотелось бы, чтобы вы как-то поменяли схему работы с курьерской доставкой в Москву. Дважды заказывал книги и дважды курьер приезжал совершенно без предупреждений. Один раз ему повезло застать меня дома. Второй раз — нет, и пришлось переназначать встречу. Крайне неудобно.


    1. ph_piter
      06.07.2017 16:12

      Спасибо, написали в личку для уточнения.


      1. Roms
        06.07.2017 20:34

        А может Вы всё же отправляете и за границу, в страны Европа? Иначе придётся заказать через какой-нибудь интернет магазин и соответственно без скидки.


        1. ph_piter
          06.07.2017 20:35

          Отправляем, любой почтовой службой, правда доставка очень дорогая будет. Напишите на сайте или сюда в личку город. Рассчитаем.


  1. odysset
    06.07.2017 16:13
    +1

    Всегда было интересно, почему именно язык питон ассоциируется с машинным обучением, что в этом языке такого магического? (опыта программирования на питоне не имею)


    1. kdenisk
      06.07.2017 17:20

      1. Питон за счёт нестрогой типизации и многих других вольностей позволяет очень быстро готовить данные, а правильно препарированные данные — немалая часть успеха в ML.

      2. Есть такая штука, как IPython Notebook — интерактивная среда, где можно очень быстро экспериментировать без необходимости компиляции программы каждый раз.

      Эти два фактора и сделали Питон де-факто стандартом для аналитика данных. Дальше всё обросло зрелыми и быстрыми библиотеками для машинного обучения и сделало Python лидером в ML.


      1. odysset
        07.07.2017 11:14

        А что насчет lua? Ведь он тоже нестрого типизированный язык. Так же, на сколько я понял — самый быстрый скриптовой язык. Тогда почему именно Питон? Не считая вашу штуку, как IPython Notebook, не особо понятен хайп, сложивший вокруг него.


        1. kdenisk
          07.07.2017 11:38

          У них разная специализация. В базовый комплект Lua не входит почти ничего, т.к. он задумывался как встраиваемый язык с тем, чтобы быстро накидать алгоритм и дёрнуть внешний API. У Python нет таких ограничений — в комплекте поставки очень богатая стандартная библиотека для решения всех «бытовых» задач.

          И, конечно, 1-based индексация массивов это какой-то ад.

          >> не особо понятен хайп, сложивший вокруг него

          Когда-то был сделан выбор в пользу Python, и он оброс таким количеством библиотек для ML, что альтернативы на сегодняшний день просто нет. Можно, конечно, привести в пример R, но он уже уступает по популярности, особенно с популяризацией нейронок и библиотек под них.


  1. mike_y_k
    07.07.2017 11:27

    Проблем с покупкой электронной версиии не обнаружил ;).
    Думаю и hardcopy не вызовет проблем — в этой части там нет разницы, только доставка.
    Письмо со ссылкой благополучно пришло и ссылка работает.

    Теперь увы немного дегтя :(.

    По сайту:
    — поле ФИО неплохо бы разделить на 2/3 отдельные части и таки определить что требуется (ФИО — в строгом смысле это инициалы);
    — уже немного раздражает неспособность разработчика (возможно по нежеланию или отсутствию времени/мотивации) переключать клавиатуру в полях для мобильных устройств — для e-mail есть более удобный формат клавиатуры;
    — доставка заказа в формате .zip наверное экономит место на сервере издательства (и работу разработчика), но у покупателя вызывает «некоторые» проблемы после получения;
    — ограничение в 30 дней выглядит странно, было бы разумнее таки хранить информацию в учётной записи. Там же можно было предоставлять доступ к 3-м вариантам для скачивания: zip/PDF/ePub;
    — два предыдущих пункта запросто решаются на сервере при любой форме хранения ;).

    Как-то так. Пошёл читать. По содержимому уже отдельно — нужно таки время на сам процесс и переваривание информации.

    PS. Изначальный комментарий почему-то не был одобрен, это его немного исправленная и дополненная версия.
    В ePub много пустых страниц (в конце каждого раздела первого уровня) и странное отображение информации в таблицах, несколько затрудняющее чтение.
    Сама книга (по первой главе) хорошо написана и качественно переведена.


  1. vba
    13.07.2017 09:52

    Эх, жаль что на питоне вся практическая часть ...