Форматы ORC и Parquet на базе HDFS +7 20.09.2023 09:02 SacredDiablo 5 Хранение данных Big Data Блог компании Конференции Олега Бунина (Онтико) Блог компании билайн
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив +3 09.06.2023 07:19 aledovskiy 12 Python Анализ и проектирование систем Data Mining Big Data Аналитика мобильных приложений Блог компании AvitoTech
Выгрузка HDFS FSImage в Hive для мониторинга и аналитики: руководство к действию +2 11.11.2022 17:48 bmurashin 7 Системное администрирование Big Data Hadoop Блог компании X5 Tech
«Kubernetes как часть data platform» 14.06.2022 17:03 oneFactor 0 Hadoop Kubernetes Блог компании oneFactor
Как в PayPal разработали Dione — Open-source-библиотеку индексирования данных для HDFS и Spark +9 23.03.2022 10:54 Olga_Mokshina 1 Big Data Хранилища данных Hadoop Блог компании VK
Воспроизводимость экспериментов Big Data +7 06.12.2021 13:00 adetbekov 0 Big Data Машинное обучение Блог компании Beeline Казахстан
Apache Ozone: следующее поколение хранилища для платформы больших данных +6 16.03.2021 07:00 Cloudera 0 Big Data Apache Хранение данных Хранилища данных Блог компании Cloudera
Как увеличить скорость чтения из HBase до 3 раз и с HDFS до 5 раз +12 12.10.2020 23:21 pustota_2009 5 Big Data Высокая производительность Хранилища данных Hadoop Блог компании Сбер
Проектирование озера данных с открытым исходным кодом 08.08.2020 03:36 CoolJuice 10 Big Data Data Engineering Блог компании OpsGuru
Форматы файлов в больших данных: краткий ликбез +12 05.06.2020 08:03 pxeno 3 Блог компании Mail.ru Group Алгоритмы Хранение данных Hadoop
Как мы строим систему обработки, хранения и анализа данных в СИБУРе +16 21.01.2019 08:21 Izayda 25 Машинное обучение Хранение данных Блог компании Цифровой СИБУР Hadoop
Сказ о том, как SQL время экономит +8 25.12.2017 05:59 sahsAGU 0 Высокая производительность SQL Microsoft SQL Server Блог компании Microsoft Хранилища данных