Ищем боттлнеки за 30 минут с помощью Jaeger трейсов +26 28.07.2022 15:31 Sovianum 3 Высокая производительность Open source Серверная оптимизация Scala Блог компании Joom
Варианты использования Java ML библиотек совместно с Spring, Docker, Spark, Rapids, CUDA +14 27.07.2022 01:37 Dartya 8 JAVA
Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka +3 04.07.2022 16:03 neoflex 1 Python Big Data Блог компании Neoflex
Создание Data Lake и Warehouse на GCP +5 19.06.2022 19:56 ETman 0 Big Data Google Cloud Platform Распределённые системы Data Engineering
«Kubernetes как часть data platform» 14.06.2022 17:03 oneFactor 0 Hadoop Kubernetes Блог компании oneFactor
Выполнение заданий потоковой обработки раз в день для 10-кратного снижения затрат +2 08.06.2022 11:46 kmoseenk 0 Data Engineering Блог компании OTUS
Строим тепловые карты в Apache Zeppelin 30.05.2022 09:29 Eljah 0 Data Mining Big Data Data Engineering
Основы работы со Spark DataFrame -1 30.04.2022 19:43 NewTechAudit 0 Программирование Python Визуализация данных Data Mining
Machine Learning много не бывает: отчёт с ML-митапа +5 21.04.2022 12:06 khavan 0 Big Data Машинное обучение Конференции Data Engineering Блог компании Ozon Tech
14 апреля приглашаем на Ozon Tech ML Meetup +8 05.04.2022 14:06 khavan 0 Big Data Машинное обучение Конференции Data Engineering Блог компании Ozon Tech
Подсчет количества пар товаров в продуктовых чеках с помощью трех инструментов: Python, Spark, SQL +1 27.03.2022 09:38 GrishenkovP 4 Python SQL Big Data
Что лучше: Spark Structured Streaming или полное прекращение работы прода? +11 24.03.2022 12:16 XHuviX 4 Python Big Data Машинное обучение Data Engineering Блог компании Ozon Tech
Как в PayPal разработали Dione — Open-source-библиотеку индексирования данных для HDFS и Spark +9 23.03.2022 10:54 Olga_Mokshina 1 Big Data Хранилища данных Hadoop Блог компании VK