Современная Lakehouse-платформа данных Data Ocean Nova +8 02.10.2024 20:24 EvgenyVilkov 0 Big Data Hadoop Хранилища данных Open source Data Engineering
Создание data lineage в Apache Atlas из логических планов Spark (не без «костылей») +2 12.09.2024 13:26 PicoPicoRobotWoman 1 Программирование Scala Apache Big Data Data Engineering
Spark Essentials: Руководство по настройке и запуску проектов Spark с помощью Scala и sbt 02.09.2024 15:09 MaxRokatansky 0 Блог компании OTUS Программирование Scala Big Data
Оптимизируем Shuffle в Spark 21.08.2024 10:24 sergei_smirnov 4 Блог компании X5 Tech Big Data IT-компании Data Engineering
Уроки, извлеченные из масштабирования до многотерабайтных датасетов 08.08.2024 11:33 breakmirrors 1 Блог компании Magnus Tech Виртуализация Big Data Машинное обучение
Cloud Native vs Cloud Agnostic в Data Engineering'е: выбираем подход 29.07.2024 12:28 Ninil 0 Big Data Хранение данных Управление разработкой Хранилища данных Data Engineering
Руководство по Apache Spark не для начинающих: оптимизация +51 18.07.2024 16:31 vladislav_shevchenko 4 Блог компании Альфа-Банк Big Data Hadoop Data Engineering
Вопросы по Apache Spark к собеседованиям для Data Engineer 15.07.2024 12:32 Falcon_eye 0 Data Engineering
Хранилища данных. Обзор технологий и подходов к проектированию 01.07.2024 11:35 Systems_Education 3 Анализ и проектирование систем Хранилища данных Data Engineering
Как упаковать бэкенд-код на Go для аналитики на базе Spark 28.06.2024 08:34 akhlestin 0 Блог компании AvitoTech Go Big Data Hadoop Data Engineering
Динамическое создание UDF в Apache Spark из строк кода: проблемы и решение («костыль») 24.06.2024 17:23 PicoPicoRobotWoman 1 Программирование Scala Apache Функциональное программирование
Автопереобучение моделей в Production 13.06.2024 15:42 IAlexOps 0 Блог компании Альфа-Банк Big Data Data Engineering
[Туториал] Пишем собственные Spark Native Functions (Часть 2) 04.06.2024 04:41 Ninil 4 Scala Big Data Hadoop Data Engineering
Быстрая Data Quality проверка на базе алгоритма adversarial validation 27.05.2024 15:08 MaximML 2 Блог компании МТС Data Mining Математика Машинное обучение Искусственный интеллект