Как мы попробовали Apache Iceberg в связке со Spark и что из этого вышло +7 19.11.2024 11:58 de_linch 9 Big Data Apache Data Engineering Блог компании Циан
Бутстрап в PySpark +7 09.10.2024 09:49 ilia_chernikov 2 Python Big Data Статистика в IT Data Engineering Блог компании X5 Tech
Автоматическая система Netflix для восстановления заданий после сбоев, основанная на машинном обучении +14 07.10.2024 09:15 mr-pickles 0 Системное администрирование Программирование Веб-разработка Машинное обучение Блог компании Wunder Fund Machine Learning System administration Programming Website development Wunder Fund corporate blog
Современная Lakehouse-платформа данных Data Ocean Nova +8 02.10.2024 20:24 EvgenyVilkov 0 Open source Big Data Хранилища данных Hadoop Data Engineering
Создание data lineage в Apache Atlas из логических планов Spark (не без «костылей») +2 12.09.2024 13:26 PicoPicoRobotWoman 1 Программирование Big Data Apache Scala Data Engineering
Spark Essentials: Руководство по настройке и запуску проектов Spark с помощью Scala и sbt 02.09.2024 15:09 MaxRokatansky 0 Программирование Big Data Scala Блог компании OTUS
Оптимизируем Shuffle в Spark 21.08.2024 10:24 sergei_smirnov 4 Big Data IT-компании Data Engineering Блог компании X5 Tech
Уроки, извлеченные из масштабирования до многотерабайтных датасетов 08.08.2024 11:33 breakmirrors 1 Виртуализация Big Data Машинное обучение Блог компании Magnus Tech
Cloud Native vs Cloud Agnostic в Data Engineering'е: выбираем подход 29.07.2024 12:28 Ninil 0 Хранение данных Big Data Управление разработкой Хранилища данных Data Engineering
Руководство по Apache Spark не для начинающих: оптимизация +51 18.07.2024 16:31 vladislav_shevchenko 4 Big Data Hadoop Блог компании Альфа-Банк Data Engineering
Вопросы по Apache Spark к собеседованиям для Data Engineer 15.07.2024 12:32 Falcon_eye 0 Data Engineering
Хранилища данных. Обзор технологий и подходов к проектированию 01.07.2024 11:35 Systems_Education 3 Анализ и проектирование систем Хранилища данных Data Engineering
Как упаковать бэкенд-код на Go для аналитики на базе Spark 28.06.2024 08:34 akhlestin 0 Go Big Data Hadoop Data Engineering Блог компании AvitoTech
Динамическое создание UDF в Apache Spark из строк кода: проблемы и решение («костыль») 24.06.2024 17:23 PicoPicoRobotWoman 1 Программирование Apache Функциональное программирование Scala