Apache Spark 3.4 для Databricks Runtime 13.0 +3 14.08.2023 12:16 alitenicole 0 Блог компании Southbridge IT-инфраструктура Apache Big Data Data Engineering
Обработка больших и очень больших графов +11 10.08.2023 23:07 neshkeev 2 Algorithms Distributed systems Алгоритмы Распределённые системы
Data Engineering: концепции, процессы и инструменты 24.07.2023 09:57 kucev 0 Анализ и проектирование систем Data Mining Хранение данных Машинное обучение Data Engineering
Градиентный бустинг: как подобрать гиперпараметры модели в 5 раз быстрее, чем обычно? +3 13.07.2023 11:55 rvishnevsky 1 Блог компании Росбанк Data Mining Apache Big Data Data Engineering
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив +3 09.06.2023 07:19 aledovskiy 12 Анализ и проектирование систем Аналитика мобильных приложений Блог компании AvitoTech Python Data Mining Big Data
PySpark для аналитика. Как правильно просить ресурсы и как понять, сколько нужно брать +10 04.05.2023 10:36 aledovskiy 14 Блог компании AvitoTech Python Data Mining Big Data
Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Автоматический подбор параметров для Spark-приложений на примере spark.executor.memory +3 24.11.2022 11:41 oneFactor 2 Блог компании Конференции Олега Бунина (Онтико) Блог компании oneFactor IT-инфраструктура Scala IT-компании
Рецепт собственной системы контроля качества данных +1 21.11.2022 13:55 neoflex 1 Data Engineering Блог компании Neoflex
Обзор End-to-End Exactly-Once семантики в Apache Flink (с Apache Kafka!) +5 16.11.2022 21:32 MaxRokatansky 0 Apache Блог компании OTUS
Машинное обучение с Apache Cassandra и Apache Spark +5 12.10.2022 13:04 MaxRokatansky 0 Блог компании OTUS NoSQL Apache Машинное обучение
Как собрать платформу обработки данных «своими руками»? +23 28.07.2022 11:06 ITSumma 1 Блог компании ITSumma Apache Big Data DIY или Сделай Сам Data Engineering
Потоковая передача данных с помощью Apache Spark и MongoDB +5 24.06.2022 14:00 kot_review 1 Блог компании FirstVDS Системное администрирование Apache
Выполнение заданий потоковой обработки раз в день для 10-кратного снижения затрат +2 08.06.2022 11:46 kmoseenk 0 Data Engineering Блог компании OTUS