Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark +10 19.06.2025 07:00 piece-of-iron 0 Блог компании МТС Big Data Data Engineering
Влияние маленьких файлов на Big Data: HDFS vs S3 +9 11.06.2025 09:50 StanislavRG 4 Блог компании Arenadata Big Data Хранилища данных Data Engineering Базы данных
Соединение SortMergeJoin в Apache Spark +3 02.06.2025 13:09 Vjatcheslav_S 0 Блог компании АО «ГНИВЦ» Hadoop Big Data Data Engineering Базы данных
Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow +5 02.06.2025 11:40 tretiakov_dm 0 Блог компании Lenta Tech Big Data Data Engineering Data Mining Python
Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2 +4 22.05.2025 13:18 VasiliyS178 3 Блог компании X5 Tech Python Алгоритмы Хранение данных Data Engineering
SRE в инженерии данных: профессия и ее перспективы +2 22.05.2025 09:30 alealandreev 0 Big Data Data Engineering DevOps Kubernetes Системное администрирование
Почему Apache Spark становится ядром аналитических платформ в России: тренды, особенности и прогнозы для бизнеса +7 20.05.2025 09:59 AI-SHA 2 Блог компании Криптонит Big Data Open source Python Apache
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов +32 15.05.2025 09:01 SacredDiablo 3 Блог компании билайн Блог компании Конференции Олега Бунина (Онтико) Big Data Data Engineering
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов +32 15.05.2025 09:01 SacredDiablo 3 Блог компании билайн Блог компании Конференции Олега Бунина (Онтико) Big Data Data Engineering
Создание ETL-движка для репликации данных из Apache Hive в Clickhouse +1 16.01.2025 21:03 DmitriiReshetnikov 10 Big Data Data Engineering Python
Apache Kyuubi + Spark: как приручить большие данные +15 14.01.2025 10:06 StanislavRG 2 Блог компании Arenadata Big Data Data Engineering DevOps Машинное обучение
Машинное обучение на Spark +13 20.12.2024 09:53 qed1337 2 Блог компании VK Big Data Машинное обучение
Как мы попробовали Apache Iceberg в связке со Spark и что из этого вышло +7 19.11.2024 11:58 de_linch 9 Блог компании Циан Apache Data Engineering Big Data
Бутстрап в PySpark +7 09.10.2024 09:49 ilia_chernikov 2 Блог компании X5 Tech Python Статистика в IT Big Data Data Engineering
Автоматическая система Netflix для восстановления заданий после сбоев, основанная на машинном обучении +14 07.10.2024 09:15 mr-pickles 0 Wunder Fund corporate blog Machine Learning Programming Website development System administration Блог компании Wunder Fund Машинное обучение Программирование Веб-разработка Системное администрирование