ETL-проект для начинающих Data Engineers: От почтового сервера до Greenplum +6 08.10.2024 12:15 KDim4eg91 11 SQL Python Data Engineering
Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go +1 03.10.2024 14:49 MaxRokatansky 3 Блог компании OTUS Go Машинное обучение
Создание data lineage в Apache Atlas из логических планов Spark (не без «костылей») +2 12.09.2024 13:26 PicoPicoRobotWoman 1 Программирование Scala Apache Big Data Data Engineering
Как мы искали альтернативу иностранному ПО 30.08.2024 08:10 vasilfatikhov 2 Блог компании ВТБ Big Data Хранилища данных
Искусство ETL. Пишем собственный движок SQL на Spark [часть 7] 23.08.2024 10:19 PastorGL 0 Open source Программирование JAVA SQL Big Data
Наш опыт эксплуатации Airflow в Kubernetes 15.08.2024 12:00 seasadm 3 Блог компании VK Блог компании Газпромбанк Управление проектами Kubernetes
Первая ракета в космосе или Миграция витрины эквайринг на Arenadata DB 13.08.2024 07:00 IvanOcta 0 Блог компании Холдинг Т1 Блог компании ВТБ Управление проектами DevOps
Эволюция корпоративной аналитики: от Excel к ClicData и Amazon QuickSight 25.06.2024 12:53 Demin_Konstantin 0 Хранилища данных Блог компании Smartup
Кто ещё здесь не разрабатывал русский BI? 16.05.2024 07:22 AnatoliyAB 1 JavaScript Apache Angular Визуализация данных Data Engineering
Apache NiFi как доступный ETL инструмент: кейс применения + тестовый стенд Docker 13.05.2024 07:16 vkhdk 8 Apache Хранение данных Data Engineering
Временное хранилище данных на Apache Druid: почему это эффективно сработало для загрузки табличных файлов 23.04.2024 11:15 Siphon 1 Python Apache Хранение данных Хранилища данных Data Engineering
Искусство ETL. Пишем собственный движок SQL на Spark [часть 6] 19.04.2024 11:06 PastorGL 6 Open source Программирование JAVA SQL Big Data