Форматы ORC и Parquet на базе HDFS +7 20.09.2023 09:02 SacredDiablo 5 Блог компании Конференции Олега Бунина (Онтико) Блог компании билайн Big Data Хранение данных
Форматы данных и файлов: руководство для архитекторов +14 15.06.2023 06:36 NigrumKross 4 Блог компании VK Big Data Машинное обучение
Выбираем формат хранения данных в экосистеме Hadoop +1 23.01.2023 14:31 NewTechAudit 11 Программирование Apache Hadoop Data Engineering
Лучший формат данных для хранения pandas.DataFrame +9 16.01.2023 12:01 V-Moskalenko 13 Блог компании Страховой Дом ВСК Python Хранение данных Data Engineering
Сколько школ во всем мире? Чтение сотен гигабайт OpenStreetMap данных в JVM из Apache Arrow +8 07.09.2022 14:31 igor_suhorukov 7 Open source PostgreSQL Программирование JAVA OpenStreetMap
Apache Spark: оптимизация производительности на реальных примерах +18 18.09.2021 01:29 valexv 6 Блог компании Neoflex Apache Big Data Хранилища данных Data Engineering
Форматы файлов в больших данных: краткий ликбез +12 05.06.2020 08:03 pxeno 3 Блог компании Mail.ru Group Алгоритмы Хранение данных Hadoop
Новое в Hadoop: познакомимся с различными форматами файлов в Hadoop +18 26.08.2019 16:59 vlstrochkov 0 Блог компании OTUS. Онлайн-образование Big Data Hadoop
Сказ о том, как SQL время экономит +8 25.12.2017 05:59 sahsAGU 0 Хранилища данных Высокая производительность SQL Microsoft SQL Server Блог компании Microsoft
Глобальная теплокарта Strava: теперь в 6 раз горячее +34 08.11.2017 08:30 m1rko 22 Проектирование и рефакторинг Обработка изображений Алгоритмы Scala Big Data
Производительность Apache Parquet +9 26.04.2016 23:47 fediq 0 Хранение данных Сжатие данных Scala Data Mining Big Data
Как использовать Parquet и не поскользнуться +10 21.03.2016 22:22 Wriketeam 14 Хранение данных Анализ и проектирование систем Big Data Apache Блог компании Wrike