Как мы распараллелили CatBoost на Spark +5 16.02.2023 14:44 val_vor 0 Big Data Apache Kubernetes Data Engineering Блог компании X5 Tech
Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Практический опыт проектирования систем графового анализа +8 15.12.2022 18:25 EvgenyVilkov 6 Анализ и проектирование систем Big Data Хранилища данных Блог компании GlowByte
Как найти «слона» в песочнице на Hadoop: решаем проблему с ограничением объёма выделенной памяти +6 05.12.2022 16:40 Sber 0 Администрирование баз данных Big Data Hadoop Блог компании Сбер
2003–2023: Краткая история Big Data +55 04.12.2022 13:00 Bright_Translate 7 Big Data Блог компании RUVDS.com Хранилища данных История IT Data Engineering
Автоматический подбор параметров для Spark-приложений на примере spark.executor.memory +3 24.11.2022 11:41 oneFactor 2 Scala Блог компании Конференции Олега Бунина (Онтико) IT-компании IT-инфраструктура Блог компании oneFactor
Выгрузка HDFS FSImage в Hive для мониторинга и аналитики: руководство к действию +2 11.11.2022 17:48 bmurashin 7 Системное администрирование Big Data Hadoop Блог компании X5 Tech
Автоматический подбор параметров для Spark-приложений +5 27.10.2022 11:12 oneFactor 7 Big Data Машинное обучение Scala IT-инфраструктура Блог компании oneFactor
Подводные камни Spark: что делать с перезаписью и дополнением в таблицах +7 12.10.2022 11:05 yrepear 0 Администрирование баз данных Хранение данных Big Data Хранилища данных Блог компании VK
Kafka как интеграционная платформа: от источников данных к потребителям и в хранилище (часть 2) +11 21.09.2022 12:11 e11it 0 Системное администрирование Big Data IT-инфраструктура Блог компании Группа НЛМК
Do It Yourself or die? Объясняем, что делать с Open Source для «импортонезависимости» на гифках из Футурамы +11 12.09.2022 09:55 kormschikova 22 Open source Софт Блог компании Ростелеком IT-компании
Kafka как интеграционная платформа: от источников данных к потребителям и в хранилище (часть 1) +22 07.09.2022 10:48 e11it 2 Системное администрирование Высокая производительность Big Data Блог компании Группа НЛМК
Что должен знать дата-инженер. Роадмап для джуниора +21 30.08.2022 11:02 vasenkovid 2 Big Data Карьера в IT-индустрии Hadoop Блог компании Lamoda Data Engineering
Параллельные вычисления в Apache Spark +6 23.08.2022 12:42 X5RetailGroup 10 Big Data Data Engineering Блог компании X5 Tech