Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Генерация конвейеров обработки данных в Dataflow +27 23.12.2022 16:00 Bright_Translate 2 Администрирование баз данных Big Data Блог компании RUVDS.com
Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka +3 04.07.2022 16:03 neoflex 1 Python Big Data Блог компании Neoflex
Подсчет количества пар товаров в продуктовых чеках с помощью трех инструментов: Python, Spark, SQL +1 27.03.2022 09:38 GrishenkovP 4 Python SQL Big Data
Что лучше: Spark Structured Streaming или полное прекращение работы прода? +11 24.03.2022 12:16 XHuviX 4 Python Big Data Машинное обучение Data Engineering Блог компании Ozon Tech
Работаем с большими наборами данных в Spark3.2.0 с использованием Pandas +3 10.12.2021 17:13 kmoseenk 1 Программирование Блог компании OTUS
Миграция данных из различных RDBMS в HADOOP +7 28.10.2021 16:43 neoflex 8 SQL Apache Hadoop Блог компании Neoflex
Построение архитектуры проекта при работе с PySpark +1 21.09.2021 18:34 X5RetailGroup 9 Python Анализ и проектирование систем Big Data Data Engineering Блог компании X5 Group
Функции высшего порядка в Spark 3.1 +4 01.09.2021 13:32 kmoseenk 0 Data Engineering Блог компании OTUS
Общего решения из коробки — нет, или Тестируем PySpark MLlib +12 16.07.2021 09:05 ValentinDom 0 Алгоритмы Python Машинное обучение Блог компании Конференции Олега Бунина (Онтико) Data Engineering
Big Data Tools EAP 12 Is Out: Experimental Python Support and Search Function in Zeppelin Notebooks 16.12.2020 14:17 olegchir 0 Big Data Python Блог компании JetBrains Scala
Big Data Tools EAP 12: экспериментальная поддержка Python, поиск по ноутбукам в Zeppelin +7 16.12.2020 14:10 olegchir 0 Big Data Python Блог компании JetBrains Scala