Форматы ORC и Parquet на базе HDFS +7 20.09.2023 09:02 SacredDiablo 5 Хранение данных Big Data Блог компании Конференции Олега Бунина (Онтико) Блог компании билайн
Форматы данных и файлов: руководство для архитекторов +14 15.06.2023 06:36 NigrumKross 4 Big Data Машинное обучение Блог компании VK
Выбираем формат хранения данных в экосистеме Hadoop +1 23.01.2023 14:31 NewTechAudit 11 Программирование Apache Hadoop Data Engineering
Лучший формат данных для хранения pandas.DataFrame +9 16.01.2023 12:01 V-Moskalenko 13 Python Хранение данных Data Engineering Блог компании Страховой Дом ВСК
Сколько школ во всем мире? Чтение сотен гигабайт OpenStreetMap данных в JVM из Apache Arrow +8 07.09.2022 14:31 igor_suhorukov 7 Программирование PostgreSQL Open source JAVA OpenStreetMap
Apache Spark: оптимизация производительности на реальных примерах +18 18.09.2021 01:29 valexv 6 Big Data Apache Хранилища данных Data Engineering Блог компании Neoflex
Форматы файлов в больших данных: краткий ликбез +12 05.06.2020 08:03 pxeno 3 Блог компании Mail.ru Group Алгоритмы Хранение данных Hadoop
Новое в Hadoop: познакомимся с различными форматами файлов в Hadoop +18 26.08.2019 16:59 vlstrochkov 0 Big Data Hadoop Блог компании OTUS. Онлайн-образование
Сказ о том, как SQL время экономит +8 25.12.2017 05:59 sahsAGU 0 Высокая производительность SQL Microsoft SQL Server Блог компании Microsoft Хранилища данных
Глобальная теплокарта Strava: теперь в 6 раз горячее +34 08.11.2017 08:30 m1rko 22 Алгоритмы Обработка изображений Scala Big Data Проектирование и рефакторинг
Производительность Apache Parquet +9 26.04.2016 23:47 fediq 0 Сжатие данных Scala Хранение данных Data Mining Big Data
Как использовать Parquet и не поскользнуться +10 21.03.2016 22:22 Wriketeam 14 Анализ и проектирование систем Apache Хранение данных Big Data Блог компании Wrike