Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2 +4 22.05.2025 13:18 VasiliyS178 3 Блог компании X5 Tech Python Алгоритмы Хранение данных Data Engineering
SRE в инженерии данных: профессия и ее перспективы +2 22.05.2025 09:30 alealandreev 0 Big Data Data Engineering DevOps Kubernetes Системное администрирование
Почему Apache Spark становится ядром аналитических платформ в России: тренды, особенности и прогнозы для бизнеса +7 20.05.2025 09:59 AI-SHA 2 Блог компании Криптонит Big Data Open source Python Apache
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов +32 15.05.2025 09:01 SacredDiablo 3 Блог компании билайн Блог компании Конференции Олега Бунина (Онтико) Big Data Data Engineering
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов +32 15.05.2025 09:01 SacredDiablo 3 Блог компании билайн Блог компании Конференции Олега Бунина (Онтико) Big Data Data Engineering
Создание ETL-движка для репликации данных из Apache Hive в Clickhouse +1 16.01.2025 21:03 DmitriiReshetnikov 10 Big Data Data Engineering Python
Apache Kyuubi + Spark: как приручить большие данные +15 14.01.2025 10:06 StanislavRG 2 Блог компании Arenadata Big Data Data Engineering DevOps Машинное обучение
Машинное обучение на Spark +13 20.12.2024 09:53 qed1337 2 Блог компании VK Big Data Машинное обучение
Как мы попробовали Apache Iceberg в связке со Spark и что из этого вышло +7 19.11.2024 11:58 de_linch 9 Блог компании Циан Apache Data Engineering Big Data
Бутстрап в PySpark +7 09.10.2024 09:49 ilia_chernikov 2 Блог компании X5 Tech Python Статистика в IT Big Data Data Engineering
Автоматическая система Netflix для восстановления заданий после сбоев, основанная на машинном обучении +14 07.10.2024 09:15 mr-pickles 0 Wunder Fund corporate blog Machine Learning Programming Website development System administration Блог компании Wunder Fund Машинное обучение Программирование Веб-разработка Системное администрирование
Современная Lakehouse-платформа данных Data Ocean Nova +8 02.10.2024 20:24 EvgenyVilkov 0 Big Data Hadoop Хранилища данных Open source Data Engineering
Создание data lineage в Apache Atlas из логических планов Spark (не без «костылей») +2 12.09.2024 13:26 PicoPicoRobotWoman 1 Программирование Scala Apache Big Data Data Engineering
Spark Essentials: Руководство по настройке и запуску проектов Spark с помощью Scala и sbt 02.09.2024 15:09 MaxRokatansky 0 Блог компании OTUS Программирование Scala Big Data
Оптимизируем Shuffle в Spark 21.08.2024 10:24 sergei_smirnov 4 Блог компании X5 Tech Big Data IT-компании Data Engineering