Spark 3.0: новые возможности и примеры их использования – часть 1 +5 30.11.2020 10:16 anna_zh 2 Блог компании New Professions Lab Scala Apache Big Data Data Engineering
Секреты производительности Spark, или Почему важна компиляция запросов +11 24.11.2020 14:54 MaxRokatansky 0 Блог компании OTUS. Онлайн-образование Программирование SQL Data Engineering
Экономичная конфигурация исполнителей Apache Spark +5 20.11.2020 12:49 MaxRokatansky 0 Блог компании OTUS. Онлайн-образование Программирование Apache Hadoop
Как дебажить запросы, используя только Spark UI +7 08.11.2020 09:10 vlstrochkov 1 Блог компании OTUS. Онлайн-образование Big Data DevOps Hadoop Data Engineering
Курс «Промышленный ML на больших данных» — что это, для кого и каких навыков требует? +8 12.10.2020 11:57 vlstrochkov 0 Блог компании OTUS. Онлайн-образование Big Data Data Engineering
Big Data Tools EAP 11: Zeppelin в DataGrip и spark-submit во всех поддерживаемых IDE +9 09.10.2020 16:35 olegchir 2 Блог компании JetBrains Java Scala Big Data
Big Data Tools Update 11 Is Out +7 09.10.2020 13:55 olegchir 0 Блог компании JetBrains Java Scala Big Data
Как мы оркестрируем процессы обработки данных с помощью Apache Airflow +21 22.09.2020 08:01 sowow359 5 Блог компании Lamoda Python Big Data Hadoop Data Engineering
Big Data Tools EAP 10: SSH-туннели, фильтрация приложений, пользовательские модули и многое другое +9 01.09.2020 14:43 olegchir 0 Блог компании JetBrains Java Scala Big Data
Проектирование озера данных с открытым исходным кодом 08.08.2020 03:36 CoolJuice 10 Блог компании OpsGuru Big Data Data Engineering
Запускаем Apache Spark на Kubernetes +6 20.07.2020 13:14 neoflex 5 Блог компании Неофлекс Apache Big Data Kubernetes
Распределенное обучение XGBoost и параллельное прогнозирование с Apache Spark +7 24.06.2020 10:24 MaxRokatansky 0 Блог компании OTUS. Онлайн-образование Apache Big Data Машинное обучение
Livy — недостающее звено цепи Hadoop Spark Airflow Python +11 09.09.2019 12:23 Korolevmv 2 Блог компании АльфаСтрахование (Сервис будущего в настоящем) Блог компании АльфаСтрахование Big Data Hadoop
Microsoft ML Spark: расширение Spark, делающее SparkML человечнее, и LightGBM как бонус +19 24.06.2019 14:03 SemyonSinchenko 4 Блог компании Райффайзенбанк Scala Big Data Машинное обучение
Парсим 25TB с помощью AWK и R +61 17.06.2019 12:09 AloneCoder 11 Анализ и проектирование систем Блог компании Mail.ru Group Высокая производительность Облачные вычисления Big Data R