Форматы ORC и Parquet на базе HDFS +7 20.09.2023 09:02 SacredDiablo 5 Блог компании Конференции Олега Бунина (Онтико) Блог компании билайн Big Data Хранение данных
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив +3 09.06.2023 07:19 aledovskiy 12 Анализ и проектирование систем Аналитика мобильных приложений Блог компании AvitoTech Python Data Mining Big Data
Выгрузка HDFS FSImage в Hive для мониторинга и аналитики: руководство к действию +2 11.11.2022 17:48 bmurashin 7 Блог компании X5 Tech Системное администрирование Big Data Hadoop
«Kubernetes как часть data platform» 14.06.2022 17:03 oneFactor 0 Блог компании oneFactor Hadoop Kubernetes
Как в PayPal разработали Dione — Open-source-библиотеку индексирования данных для HDFS и Spark +9 23.03.2022 10:54 Olga_Mokshina 1 Блог компании VK Big Data Хранилища данных Hadoop
Воспроизводимость экспериментов Big Data +7 06.12.2021 13:00 adetbekov 0 Блог компании Beeline Казахстан Big Data Машинное обучение
Apache Ozone: следующее поколение хранилища для платформы больших данных +6 16.03.2021 07:00 Cloudera 0 Блог компании Cloudera Apache Big Data Хранение данных Хранилища данных
Как увеличить скорость чтения из HBase до 3 раз и с HDFS до 5 раз +12 12.10.2020 23:21 pustota_2009 5 Блог компании Сбер Высокая производительность Big Data Хранилища данных Hadoop
Проектирование озера данных с открытым исходным кодом 08.08.2020 03:36 CoolJuice 10 Блог компании OpsGuru Big Data Data Engineering
Форматы файлов в больших данных: краткий ликбез +12 05.06.2020 08:03 pxeno 3 Блог компании Mail.ru Group Алгоритмы Хранение данных Hadoop
Как мы строим систему обработки, хранения и анализа данных в СИБУРе +16 21.01.2019 08:21 Izayda 25 Блог компании Цифровой СИБУР Hadoop Машинное обучение Хранение данных
Сказ о том, как SQL время экономит +8 25.12.2017 05:59 sahsAGU 0 Хранилища данных Высокая производительность SQL Microsoft SQL Server Блог компании Microsoft