ClickHouse в ритейловом проекте +6 26.06.2023 06:48 ilya-panov 2 Блог компании X5 Tech IT-инфраструктура Big Data IT-компании Data Engineering
Спиливаем spill-ы +17 22.06.2023 11:33 SacredDiablo 3 билайн corporate blog High performance Блог компании билайн Высокая производительность Scala Big Data DevOps
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив +3 09.06.2023 07:19 aledovskiy 12 Анализ и проектирование систем Аналитика мобильных приложений Блог компании AvitoTech Python Data Mining Big Data
Масштабируемая Big Data система в Kubernetes с использованием Spark и Cassandra +14 03.06.2023 11:36 Dartya 2 JAVA Big Data Kotlin
PySpark для аналитика. Как правильно просить ресурсы и как понять, сколько нужно брать +10 04.05.2023 10:36 aledovskiy 14 Блог компании AvitoTech Python Data Mining Big Data
Проблемы приземления данных из Kafka и их решения на Apache Flink +8 27.04.2023 09:17 olegbunin 0 Блог компании Конференции Олега Бунина (Онтико) Высокая производительность Apache Big Data
Apache Sedona — как быстро работать с геоданными +11 04.04.2023 09:02 denis_afanasyev 15 Исследования и прогнозы в IT Блог компании билайн Геоинформационные сервисы Big Data Статистика в IT
Платформа данных в Леруа Мерлен — как мы победили масштабирование +9 08.02.2023 08:08 alextokarev 17 Блог компании Леруа Мерлен Big Data Хранение данных Data Engineering
Знакомство с Fugue — уменьшаем шероховатости при работе с PySpark +2 12.01.2023 22:27 rufous86 1 Машинное обучение Python Big Data Hadoop Data Engineering
Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Количество партиций в Spark DataFrame, DataSet на основе Relational Data Base table +1 07.12.2022 13:03 GolovinDS 0 Data Engineering Блог компании OTUS
2003–2023: Краткая история Big Data +55 04.12.2022 13:00 Bright_Translate 7 Блог компании RUVDS.com Big Data Хранилища данных История IT Data Engineering
Совместный доступ к Spark-датасетам из разных приложений — Redis нам в помощь +1 02.12.2022 14:25 MaxRokatansky 0 Хранение данных Блог компании OTUS
Автоматический подбор параметров для Spark-приложений на примере spark.executor.memory +3 24.11.2022 11:41 oneFactor 2 Блог компании Конференции Олега Бунина (Онтико) Блог компании oneFactor IT-инфраструктура Scala IT-компании