PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив +3 09.06.2023 07:19 aledovskiy 12 Анализ и проектирование систем Аналитика мобильных приложений Блог компании AvitoTech Python Data Mining Big Data
Паттерны проектирования для систем машинного обучения. Часть 1 +5 15.05.2023 12:05 MaxRokatansky 0 Машинное обучение Блог компании OTUS
Основные инструменты для работы в Data Engineering: введение для начинающих Data Engineer'ов -1 07.04.2023 08:51 nadejda_cherneva 2 Python Data Mining Big Data Data Engineering
Как мы распараллелили CatBoost на Spark +5 16.02.2023 14:44 val_vor 0 Блог компании X5 Tech Apache Big Data Kubernetes Data Engineering
Знакомство с Fugue — уменьшаем шероховатости при работе с PySpark +2 12.01.2023 22:27 rufous86 1 Машинное обучение Python Big Data Hadoop Data Engineering
Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Генерация конвейеров обработки данных в Dataflow +27 23.12.2022 16:00 Bright_Translate 2 Блог компании RUVDS.com Администрирование баз данных Big Data
Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka +3 04.07.2022 16:03 neoflex 1 Блог компании Neoflex Python Big Data
Подсчет количества пар товаров в продуктовых чеках с помощью трех инструментов: Python, Spark, SQL +1 27.03.2022 09:38 GrishenkovP 4 Python SQL Big Data
Что лучше: Spark Structured Streaming или полное прекращение работы прода? +11 24.03.2022 12:16 XHuviX 4 Блог компании Ozon Tech Python Big Data Машинное обучение Data Engineering
Работаем с большими наборами данных в Spark3.2.0 с использованием Pandas +3 10.12.2021 17:13 kmoseenk 1 Программирование Блог компании OTUS
Миграция данных из различных RDBMS в HADOOP +7 28.10.2021 16:43 neoflex 8 Блог компании Neoflex SQL Apache Hadoop
Построение архитектуры проекта при работе с PySpark +1 21.09.2021 18:34 X5RetailGroup 9 Блог компании X5 Group Python Анализ и проектирование систем Big Data Data Engineering
Функции высшего порядка в Spark 3.1 +4 01.09.2021 13:32 kmoseenk 0 Data Engineering Блог компании OTUS
Общего решения из коробки — нет, или Тестируем PySpark MLlib +12 16.07.2021 09:05 ValentinDom 0 Блог компании Конференции Олега Бунина (Онтико) Python Алгоритмы Машинное обучение Data Engineering