Как обрабатывать объекты Avro с помощью датасетов Spark 3.2 & Scala 2.12 +10 07.02.2022 16:56 alchash 0 Big Data Scala Data Engineering Блог компании OTUS
Что нового в Apache Spark 3.2.0 — RocksDB state store +3 20.12.2021 19:29 MaxRokatansky 0 Программирование Apache Блог компании OTUS
Работаем с большими наборами данных в Spark3.2.0 с использованием Pandas +3 10.12.2021 17:13 kmoseenk 1 Программирование Блог компании OTUS
Руководство по Databricks Certified Associate Developer for Apache Spark 3.0 +2 30.11.2021 18:14 kmoseenk 0 Data Engineering Блог компании OTUS
Кастомные агрегаторы в Spark SQL +2 01.11.2021 16:15 Ninil 3 Big Data Хранилища данных Data Engineering
Изменить сохранения Spark Часть вторая: реализация партишенера +6 12.10.2021 15:04 Sber 0 Администрирование баз данных Big Data Блог компании Сбер
Изменить сохранения Spark! Часть первая: разделяй и… сортируй +4 07.10.2021 10:45 Sber 0 Администрирование баз данных Big Data Блог компании Сбер
Lightbend Cloudflow. Разработка конвейеров потоковой обработки данных +4 01.10.2021 14:15 nathandope 0 Big Data Scala Data Engineering Блог компании Neoflex
Построение архитектуры проекта при работе с PySpark +1 21.09.2021 18:34 X5RetailGroup 9 Python Анализ и проектирование систем Big Data Data Engineering Блог компании X5 Group
Почему лучше НЕ использовать CSV с Apache Spark +5 20.09.2021 19:55 kmoseenk 2 Data Engineering Блог компании OTUS
Экосистема ваших Big Data-кластеров из решении Apache в Docker-контейнерах на Linux-машинах -5 14.09.2021 09:07 seregazolotaryow64 7 Open source Big Data DevOps Hadoop Data Engineering
Функции высшего порядка в Spark 3.1 +4 01.09.2021 13:32 kmoseenk 0 Data Engineering Блог компании OTUS
Обработка больших данных: первые шаги в понимании Hadoop MapReduce и Spark +5 23.07.2021 17:20 Kannoken 10 Big Data Apache Блог компании Luxoft Hadoop Data Engineering
Общего решения из коробки — нет, или Тестируем PySpark MLlib +12 16.07.2021 09:05 ValentinDom 0 Алгоритмы Python Машинное обучение Блог компании Конференции Олега Бунина (Онтико) Data Engineering
Как работать с Big Data быстрее и эффективнее: Kubernetes для Data Science +13 28.06.2021 06:48 volinski 4 Big Data Блог компании Mail.ru Group Облачные вычисления Kubernetes Data Engineering