Хабр, привет!
В марте я восстановил публикацию на Хабре дайджеста посвященного ML и Data Science. Сегодня я подготовил свежую подборку интересных ссылок, а также анонсирую запуск Telegram-канала дайджеста, в котором ежедневно публикую ссылки на интересные материалы, связанные с AI & ML. Приглашаю всех присоединяться к нему. А пока предлагаю свежую подборку материалов под катом.
Статьи
- Forecasting at Uber: An Introduction — статья является первой в серии, посвященной объяснению того, как Uber использует прогнозирование для создания более качественных продуктов и услуг.
- Как стать Data Engineer.
- Structural Time Series Modeling in TensorFlow Probability — о tfp.sts, новой библиотеке в TensorFlow Probability для прогнозирования временных рядов с использованием структурных моделей временных рядов.
- How to Version Control Jupyter Notebooks — обзор различных способов управления версиями Jupyter Notebooks, включая встроенные решения и внешние инструменты.
- Для чего и как мы скрываем госномера автомобилей в объявлениях Авито.
- Computer Vision Tutorial: A Step-by-Step Introduction to Image Segmentation Techniques — пошаговое руководство введения в сегментацию изображений.
- Jupyter Lab: Evolution of the Jupyter Notebook — обзор JupyterLab, следующего поколения ноутбуков Jupyter.
- Hands-on TensorFlow Tutorial: Train ResNet-50 from Scratch Using the ImageNet Dataset — практическое руководство по обучению модели ResNet в TensorFlow. От запуска TensorFlow, загрузки и подготовки ImageNet, вплоть до документирования и подготовки отчетов.
- How to Choose the Right Chart Type — инфографика, которая показывает возможные типы диаграмм, которые вы можете использовать в зависимости от имеющихся у вас данных.
- Tutorial: Poisson Regression in R — руководство о регрессии Пуассона, что это такое и как программисты R могут использовать ее в реальных приложениях.
- GANSynth: Making music with GANs — введение в GANSynth, методе генерации высококачественного звука с помощью Generative Adversarial Networks (GAN).
- Frameworks for Machine Learning Model Management — сравнение трех популярных инструментов для управления жизненным циклом моделей/проектов машинного обучения: MLFlow, DVC и Sacred.
Проект
- Pandaral·lel — простой и эффективный инструмент для распараллеливания ваших Pandas операций на всех доступных процессорах.
Datasets
Книги
- Dive into Deep Learning — интерактивная книга глубокого обучения с кодом, математикой и захватывающими дискуссиями.
- 15 лучших книг по глубинному обучению.
Видео
- Scaled Machine Learning Conference 2019.
- Теория игр вокруг нас — отличная лекция о теории игр, применении ее в повседневной жизни и о том, как не проиграть.
Мероприятия
- Eastern European Conference on Computer Vision —
6-7 июля, Одесса. - Lviv Data Science Summer School — 22 июля — 2 августа, Львов. Регистрация открыта до 1 мая. В программе школы уже заявлено 12 курсов по направлениям: Computer Vision, Natural Language Processing, Healthcare, Social Network Analysis, Urban Data Science и другим.
На email-рассылку дайджеста можно подписаться здесь или присоединиться к группам в соц сетях: Facebook, Twitter, Telegram.
Если вы из Одессы, присоединяйтесь к нашей группе в FB или meetup.com.
Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя полезное. Буду благодарен за любые предложения для следующего дайджеста. Свои ссылки можно присылать здесь.
< — Предыдущий выпуск: Data Science Digest
eugene_bx
Может добавить пару оценок для статей.
1. Сложность — beginner, intermediate, advanced
2. Качество — что-то типа общей оценки, насколько качественная статья. Понятно что будет очень субъективная, но всё равно думаю может быть полезно. Главное не раздавать высший бал сильно часто, а то доверие к нему потеряется.
m31 Автор
Спасибо за идеи. Попробую реализовать. 1 — это не сложно, а вот с 2 будет посложнее, но что-то придумаю.
eugene_bx
#2, просто поверхностно пробежать статью и выдать оценку по внутреннему ощущению.