Приветствую всех!

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning и не забывайте подписываться на наш Telegram-канал.


Статьи

How to Use XGBoost for Time Series Forecasting - небольшой туториал об использовании XGBoost для прогнозирования временных рядов

Genetic Algorithms for Natural Language Processing - вводная статья о генетических алгоритмах и об их взаимодействии с NLP алгоритмами.

Differential Evolution from Scratch in Python - статья о методах применения и использования алгоритмов дифференциальной эволюции на Python.

Style Your Pandas DataFrame and Make It Stunning - техники использования встроенных методов работы с датафреймами на Pandas.

The FLORES-101 Data Set: Helping Build Better Translation Systems Around the World - обзор FLORES-101, нового мультиуровневого датасета для разработки более совершенных систем перевода от команды Facebook AI.

Научные статьи

Alias-Free GAN - новое исследование о применении продвинутых генеративных моделей для работы с изображениями, видео и анимацией от NVIDIA.

You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection - работа от китайских ученых об You Only Look at One Sequence (YOLOS), новом наборе моделей для детекции предметов.

CoAtNet: Marrying Convolution and Attention for All Data Sizes - научная работа о CoAtNets, новом семействе гибридных сверточных моделей.

Consistent Instance False Positive Improves Fairness in Face Recognition - обзор нового метода уменьшения ложных срабатываний при распознавании лиц.

Multivariate Probabilistic Regression with Natural Gradient Boosting - новый эффективный метод многомерной вероятностной регрессии с естественным усилением градиента.

DynamicViT: Efficient Vision Transformers with Dynamic Token Sparsification - фреймворк динамического разбиения токенов для постепенного и динамического удаления избыточных токенов в зависимости от входных данных.

Проекты

MLOps Toys - каталог MLOps тулзов с возможностью поиска по категориям.

Видео

Data Governance - предметный разговор об управлении данными.

Ingestion and Historization in the Data Lake - доклад о приеме и историзации данных в озерах данных.


Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя что-то полезное. Буду благодарен за любые предложения для следующего дайджеста.

Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: TwitterFacebook, а также подписывайтесь на нашу еженедельную рассылку.

< Предыдущий выпуск.