Извилистый путь через «скалу» в Spark: как одинэсник стал дата-инженером и полюбил строго типизированные языки +4 22.11.2022 10:00 Tituch 3 Блог компании Криптонит Программирование Scala Карьера в IT-индустрии Data Engineering
Apache Spark на Kubernetes: какие уроки можно извлечь из запуска миллионов исполнителей Spark +3 18.11.2022 13:11 Olga_Mokshina 0 Блог компании VK Big Data DevOps Kubernetes
Автоматический подбор параметров для Spark-приложений +5 27.10.2022 11:12 oneFactor 7 Блог компании oneFactor IT-инфраструктура Scala Big Data Машинное обучение
Realtime-матчинг: находим матчи за считанные минуты вместо 24 часов +35 14.10.2022 12:08 alex_golubev13 3 Блог компании Ozon Tech Python Обработка изображений Машинное обучение Natural Language Processing
Подводные камни Spark: что делать с перезаписью и дополнением в таблицах +7 12.10.2022 11:05 yrepear 0 Блог компании VK Администрирование баз данных Big Data Хранение данных Хранилища данных
Потери данных при репликации в аналитическое хранилище — автоматические сверки и мониторинг качества данных +15 22.09.2022 15:01 gladkikhtutu 19 Блог компании Туту.ру Администрирование баз данных Big Data Хранение данных
Заметки дата-инженера: интеграция Kafka и PySpark -1 05.09.2022 13:07 neoflex 3 Блог компании Neoflex Python Программирование Big Data
Количество партиций в Spark при инициализации Data API: DataFrame, RDD, DataSet +6 02.09.2022 18:17 MaxRokatansky 0 API Блог компании OTUS
Что должен знать дата-инженер. Роадмап для джуниора +21 30.08.2022 11:02 vasenkovid 2 Блог компании Lamoda Big Data Карьера в IT-индустрии Hadoop Data Engineering
Как организовать потоковую обработку данных. Часть 1 +10 25.08.2022 14:00 newnew94 4 Блог компании МТС Data Mining Big Data Data Engineering
Параллельные вычисления в Apache Spark +6 23.08.2022 12:42 X5RetailGroup 10 Блог компании X5 Tech Big Data Data Engineering
Пять советов по исправлению перекошенных соединений в Apache Spark +2 03.08.2022 11:00 1shaman 0 Блог компании FirstVDS SQL Серверная оптимизация Apache
Как реализовать магию Sqoop для загрузки данных через Spark +10 29.07.2022 16:19 Bee_brightside 2 Блог компании Билайн Бизнес SQL Big Data Хранение данных Hadoop
Ищем боттлнеки за 30 минут с помощью Jaeger трейсов +26 28.07.2022 15:31 Sovianum 3 Блог компании Joom Высокая производительность Open source Серверная оптимизация Scala
Варианты использования Java ML библиотек совместно с Spring, Docker, Spark, Rapids, CUDA +14 27.07.2022 01:37 Dartya 8 JAVA