Заметки дата-инженера: интеграция Kafka и PySpark -1 05.09.2022 13:07 neoflex 3 Блог компании Neoflex Python Программирование Big Data
Количество партиций в Spark при инициализации Data API: DataFrame, RDD, DataSet +6 02.09.2022 18:17 MaxRokatansky 0 API Блог компании OTUS
Что должен знать дата-инженер. Роадмап для джуниора +21 30.08.2022 11:02 vasenkovid 2 Блог компании Lamoda Big Data Карьера в IT-индустрии Hadoop Data Engineering
Как организовать потоковую обработку данных. Часть 1 +10 25.08.2022 14:00 newnew94 4 Блог компании МТС Data Mining Big Data Data Engineering
Параллельные вычисления в Apache Spark +6 23.08.2022 12:42 X5RetailGroup 10 Блог компании X5 Tech Big Data Data Engineering
Пять советов по исправлению перекошенных соединений в Apache Spark +2 03.08.2022 11:00 1shaman 0 Блог компании FirstVDS SQL Серверная оптимизация Apache
Как реализовать магию Sqoop для загрузки данных через Spark +10 29.07.2022 16:19 Bee_brightside 2 Блог компании Билайн Бизнес SQL Big Data Хранение данных Hadoop
Ищем боттлнеки за 30 минут с помощью Jaeger трейсов +26 28.07.2022 15:31 Sovianum 3 Блог компании Joom Высокая производительность Open source Серверная оптимизация Scala
Варианты использования Java ML библиотек совместно с Spring, Docker, Spark, Rapids, CUDA +14 27.07.2022 01:37 Dartya 8 JAVA
Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka +3 04.07.2022 16:03 neoflex 1 Блог компании Neoflex Python Big Data
Создание Data Lake и Warehouse на GCP +5 19.06.2022 19:56 ETman 0 Big Data Google Cloud Platform Распределённые системы Data Engineering
«Kubernetes как часть data platform» 14.06.2022 17:03 oneFactor 0 Блог компании oneFactor Hadoop Kubernetes
Выполнение заданий потоковой обработки раз в день для 10-кратного снижения затрат +2 08.06.2022 11:46 kmoseenk 0 Data Engineering Блог компании OTUS
Строим тепловые карты в Apache Zeppelin 30.05.2022 09:29 Eljah 0 Data Mining Big Data Data Engineering
Основы работы со Spark DataFrame -1 30.04.2022 19:43 NewTechAudit 0 Python Программирование Data Mining Визуализация данных