Количество партиций в Spark при инициализации Data API: DataFrame, RDD, DataSet +6 02.09.2022 18:17 MaxRokatansky 0 API Блог компании OTUS
Что должен знать дата-инженер. Роадмап для джуниора +21 30.08.2022 11:02 vasenkovid 2 Big Data Карьера в IT-индустрии Hadoop Блог компании Lamoda Data Engineering
Как организовать потоковую обработку данных. Часть 1 +10 25.08.2022 14:00 newnew94 4 Data Mining Big Data Блог компании МТС Data Engineering
Параллельные вычисления в Apache Spark +6 23.08.2022 12:42 X5RetailGroup 10 Big Data Data Engineering Блог компании X5 Tech
Пять советов по исправлению перекошенных соединений в Apache Spark +2 03.08.2022 11:00 1shaman 0 SQL Серверная оптимизация Apache Блог компании FirstVDS
Как реализовать магию Sqoop для загрузки данных через Spark +10 29.07.2022 16:19 Bee_brightside 2 Хранение данных SQL Big Data Hadoop Блог компании Билайн Бизнес
Ищем боттлнеки за 30 минут с помощью Jaeger трейсов +26 28.07.2022 15:31 Sovianum 3 Высокая производительность Open source Серверная оптимизация Scala Блог компании Joom
Варианты использования Java ML библиотек совместно с Spring, Docker, Spark, Rapids, CUDA +14 27.07.2022 01:37 Dartya 8 JAVA
Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka +3 04.07.2022 16:03 neoflex 1 Python Big Data Блог компании Neoflex
Создание Data Lake и Warehouse на GCP +5 19.06.2022 19:56 ETman 0 Big Data Google Cloud Platform Распределённые системы Data Engineering
«Kubernetes как часть data platform» 14.06.2022 17:03 oneFactor 0 Hadoop Kubernetes Блог компании oneFactor
Выполнение заданий потоковой обработки раз в день для 10-кратного снижения затрат +2 08.06.2022 11:46 kmoseenk 0 Data Engineering Блог компании OTUS
Строим тепловые карты в Apache Zeppelin 30.05.2022 09:29 Eljah 0 Data Mining Big Data Data Engineering
Основы работы со Spark DataFrame -1 30.04.2022 19:43 NewTechAudit 0 Программирование Python Визуализация данных Data Mining
Machine Learning много не бывает: отчёт с ML-митапа +5 21.04.2022 12:06 khavan 0 Big Data Машинное обучение Конференции Data Engineering Блог компании Ozon Tech