Экономичная конфигурация исполнителей Apache Spark +5 20.11.2020 12:49 MaxRokatansky 0 Apache Программирование Hadoop Блог компании OTUS. Онлайн-образование
Как дебажить запросы, используя только Spark UI +7 08.11.2020 09:10 vlstrochkov 1 DevOps Big Data Hadoop Блог компании OTUS. Онлайн-образование Data Engineering
Курс «Промышленный ML на больших данных» — что это, для кого и каких навыков требует? +8 12.10.2020 11:57 vlstrochkov 0 Big Data Блог компании OTUS. Онлайн-образование Data Engineering
Big Data Tools EAP 11: Zeppelin в DataGrip и spark-submit во всех поддерживаемых IDE +9 09.10.2020 16:35 olegchir 2 Big Data Java Блог компании JetBrains Scala
Big Data Tools Update 11 Is Out +7 09.10.2020 13:55 olegchir 0 Big Data Java Блог компании JetBrains Scala
Как мы оркестрируем процессы обработки данных с помощью Apache Airflow +21 22.09.2020 08:01 sowow359 5 Big Data Python Блог компании Lamoda Hadoop Data Engineering
Big Data Tools EAP 10: SSH-туннели, фильтрация приложений, пользовательские модули и многое другое +9 01.09.2020 14:43 olegchir 0 Big Data Java Блог компании JetBrains Scala
Проектирование озера данных с открытым исходным кодом 08.08.2020 03:36 CoolJuice 10 Big Data Data Engineering Блог компании OpsGuru
Запускаем Apache Spark на Kubernetes +6 20.07.2020 13:14 neoflex 5 Big Data Apache Kubernetes Блог компании Неофлекс
Распределенное обучение XGBoost и параллельное прогнозирование с Apache Spark +7 24.06.2020 10:24 MaxRokatansky 0 Машинное обучение Big Data Apache Блог компании OTUS. Онлайн-образование
Livy — недостающее звено цепи Hadoop Spark Airflow Python +11 09.09.2019 12:23 Korolevmv 2 Big Data Hadoop Блог компании АльфаСтрахование (Сервис будущего в настоящем) Блог компании АльфаСтрахование
Microsoft ML Spark: расширение Spark, делающее SparkML человечнее, и LightGBM как бонус +19 24.06.2019 14:03 SemyonSinchenko 4 Машинное обучение Big Data Блог компании Райффайзенбанк Scala
Парсим 25TB с помощью AWK и R +61 17.06.2019 12:09 AloneCoder 11 Big Data Блог компании Mail.ru Group Анализ и проектирование систем Высокая производительность Облачные вычисления R
Spark Structured Streaming Applications on Kubernetes. Опыт ФАСТЕН РУС +6 26.03.2019 09:35 sergeysamsonov 3 Из песочницы Big Data
Python vs. Scala для Apache Spark — ожидаемый benchmark с неожиданным результатом +30 13.03.2019 07:42 dmitrybugaychenko 55 Big Data Блог компании Mail.ru Group Python Data Mining Блог компании Одноклассники