Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Автоматический подбор параметров для Spark-приложений на примере spark.executor.memory +3 24.11.2022 11:41 oneFactor 2 Блог компании Конференции Олега Бунина (Онтико) Блог компании oneFactor IT-инфраструктура Scala IT-компании
Рецепт собственной системы контроля качества данных +1 21.11.2022 13:55 neoflex 1 Data Engineering Блог компании Neoflex
Обзор End-to-End Exactly-Once семантики в Apache Flink (с Apache Kafka!) +5 16.11.2022 21:32 MaxRokatansky 0 Apache Блог компании OTUS
Машинное обучение с Apache Cassandra и Apache Spark +5 12.10.2022 13:04 MaxRokatansky 0 Блог компании OTUS NoSQL Apache Машинное обучение
Как собрать платформу обработки данных «своими руками»? +23 28.07.2022 11:06 ITSumma 1 Блог компании ITSumma Apache Big Data DIY или Сделай Сам Data Engineering
Потоковая передача данных с помощью Apache Spark и MongoDB +5 24.06.2022 14:00 kot_review 1 Блог компании FirstVDS Системное администрирование Apache
Выполнение заданий потоковой обработки раз в день для 10-кратного снижения затрат +2 08.06.2022 11:46 kmoseenk 0 Data Engineering Блог компании OTUS
Apache Spark, объяснение ключевых терминов -2 28.11.2021 15:37 VorobevEI 7 Apache Big Data Data Engineering
Мониторинг Spark Streaming в Kubernetes с помощью Prometheus и Grafana +4 13.10.2021 15:04 MaxRokatansky 0 Блог компании OTUS Apache Kubernetes
Путь, который занял 100* лет: встречаем CatBoost 1.0.0 +58 01.10.2021 13:09 kizill 8 Блог компании Яндекс Open source R Машинное обучение Распределённые системы
Плагин Big Data Tools теперь поддерживает IntelliJ IDEA Ultimate, PyCharm Professional, DataGrip 2021.3 EAP и DataSpell +8 28.09.2021 09:17 olegchir 0 Блог компании JetBrains Программирование Big Data Data Engineering
Apache Spark: оптимизация производительности на реальных примерах +18 18.09.2021 01:29 valexv 6 Блог компании Neoflex Apache Big Data Хранилища данных Data Engineering