Современная Lakehouse-платформа данных Data Ocean Nova +8 02.10.2024 20:24 EvgenyVilkov 0 Open source Big Data Хранилища данных Hadoop Data Engineering
Как мы ускорили Trino, научив оптимизатор удалять ненужные Join +10 17.09.2024 05:30 devozerov 2 SQL Big Data Data Engineering Блог компании CedrusData
Как вырастить динозавра: масштабирование платформы YTsaurus от 200 до 20 000 хостов. Доклад Яндекса +217 19.07.2024 07:00 YandexCloudEditor 1 Блог компании Яндекс Анализ и проектирование систем Высокая производительность Блог компании Yandex Cloud & Yandex Infrastructure
Создание Data Lake и Warehouse на GCP +5 19.06.2022 19:56 ETman 0 Big Data Google Cloud Platform Распределённые системы Data Engineering
ETL-пайплайны на Airflow: Хороший, Плохой, Злой +4 11.10.2021 21:42 Ejhi 3 Python Open source Хранилища данных Data Engineering
Как не утонуть в озере данных: инструкция от РСХБ +7 19.08.2021 11:00 YuryDL 0 Хранение данных Big Data Блог компании Россельхозбанк
Платформа данных в Леруа Мерлен. Part 2. Обновления 2021 года: Flink и Superset +6 15.07.2021 13:35 diarworld 16 Облачные вычисления Big Data Хранилища данных Блог компании Леруа Мерлен
Платформа данных в Леруа Мерлен – 2 года, сотни источников и более 2.000 пользователей +4 09.06.2021 13:27 diarworld 11 Big Data Облачные вычисления Хранилища данных Блог компании Леруа Мерлен
Проектирование озера данных с открытым исходным кодом 08.08.2020 03:36 CoolJuice 10 Big Data Data Engineering Блог компании OpsGuru
Как мы строим систему обработки, хранения и анализа данных в СИБУРе +16 21.01.2019 08:21 Izayda 25 Машинное обучение Хранение данных Блог компании Цифровой СИБУР Hadoop