
Хабр, привет!
Очень давно я вел на Хабре дайджест посвященный AI и BigData. Сейчас хочу восстановить его и раз в месяц делать подборку интересных материалов из области Data Science.
В январе я начал опрос дата-сайентистов об их рабочих инструментах. За это время в нем уже приняло участие больше 600 человек. До 3 марта в нем еще можно принять участие, если вы это еще не сделали. Опубликовать результаты я планирую в 10-х числах марта, а пока предлагаю свежую подборку материалов под катом.
Статьи
- Scaling Machine Learning Productivity at LinkedIn — о подходе в LinkedIn к масштабировании ML систем и шерингу знаний среди инженеров.
- Image Segmentation using Python’s scikit-image module — обзор методов сегментации изображений с помощью scikit-image.
- Breast cancer classification with Keras and Deep Learning — о разработке ML модели для прогнозирования рака молочной железы, используя гистологические изображения.
- Overview of the TOP Algorithms for Machine Learning. Part 1 — в первой части рассматриваются разные типы машинного обучения, а также такие алгоритмы, как линейная регрессия, K-Nearest Neighbors (kNN) и свёрточная нейронная сеть. Примеры на Python прилагаются.
- Building fully custom machine learning models on AWS SageMaker — практическое руководство по работе с AWS SageMaker.
- Keras, Regression, and CNNs — о разработке сверточной нейронной сети для прогнозирования регрессии с помощью Keras и прогнозирования цены на жилье на основе набора изображений.
- What Kagglers are using for Text Classification — обзор моделей для классификации текста с примерами их использования.
- AlphaStar: Mastering the Real-Time Strategy Game StarCraft II — об AlphaStar, которая победила в StarCraft II лучших профессиональных игроков.
- Fashion MNIST with Keras and Deep Learning — о создании сверточной нейронной сети для классификации одежды с помощью Fashion MNIST датасета.
- Сравнение разных GPU по производительности и цене для Deep Learning можно найти в материале Tim Dettmers, который он постоянно обновляет. А если вам для работы нужны будут Multi-GPU сервера, то я будем рады помочь с этим. Можно писать мне в личку.
- An overview of the NLP ecosystem in R — Mindmap карта NLP экосистемы в R.
- Framework for Better Deep Learning.
- Predicting Irish electricity consumption with neural networks in R and Python — о создании нейронной сети для прогнозирования потребления энергии на R и Python.
Проекты
- Papers with Code — проект, который содержит ссылки на статьи по машинному обучению вместе с соответствующим кодом.
- Recommenders — open-source проект от Microsoft, в котором собраны лучшие практики для построения рекомендательных систем.
Книги
- MATLAB Deep Learning: With Machine Learning, Neural Networks and Artificial Intelligence by Phil Kim
- Great Books for Data Science
- 13 Classic Mathematics Books for Lifelong Learners
Видео
Мероприятия
- 16 марта в Киеве состоится
6-я ежегодная конференция Data Science UA. Программа на сайте, скидочный промокод — DataScienceDigest. - List of Machine Learning / Deep Learning conferences in 2019
У меня есть англоязычная версия этого дайджеста, на рассылку которого можно подписаться здесь. Также я создал для дайджеста группы в соц сетях (Facebook, Twitter, Telegram) и чтобы, не дожидаясь даты выхода дайджеста, сразу публиковать в них ссылки на интересные материалы.
Если вы из Одессы, присоединяйтесь к нашей группе в FB или meetup.com.
Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя полезное. Буду благодарен за любые предложения для следующего дайджеста.
ericgrig
Дмитрий, спасибо за подборку.
Вы собрали полезную информацию и поделились этим. Многим, особенно начинающим,
такие ссылки будут полезны.