Apache Kyuubi + Spark: как приручить большие данные +15 14.01.2025 10:06 StanislavRG 2 Блог компании Arenadata Big Data Data Engineering DevOps Машинное обучение
Опыт Звука: как реализовать рекомендательную систему аудиокниг с использованием больших языковых моделей (LLM) +5 26.12.2024 10:48 Dmitry_Berestnev 1 Блог компании HiFi-стриминг Звук Python Машинное обучение Искусственный интеллект Анализ и проектирование систем
Тестирование систем и движков массивно-параллельных вычислений. Сравнение Impala, Trino и GreenPlum -1 16.12.2024 07:40 EvgenyVilkov 7 Big Data Hadoop Хранилища данных Open source Data Engineering
Современная Lakehouse-платформа данных Data Ocean Nova +8 02.10.2024 20:24 EvgenyVilkov 0 Big Data Hadoop Хранилища данных Open source Data Engineering
Как упаковать бэкенд-код на Go для аналитики на базе Spark 28.06.2024 08:34 akhlestin 0 Блог компании AvitoTech Go Big Data Hadoop Data Engineering
Интеграция PostgreSQL и Hadoop 28.05.2024 17:37 badcasedaily1 0 OTUS corporate blog Блог компании OTUS PostgreSQL Hadoop
SPARK для «малышей» 17.04.2024 13:57 vladislav_shevchenko 0 Блог компании Альфа-Банк Hadoop Data Engineering
Оптимизация запроса и запрос оптимизации +2 25.11.2023 20:11 Falcon_eye 11 SQL Администрирование баз данных Hadoop Data Engineering
Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди +12 07.11.2023 10:53 vladislav_shevchenko 7 Блог компании Альфа-Банк Apache Big Data DevOps Data Engineering
Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде -1 29.09.2023 14:51 sle_mary 0 Блог компании МегаФон Python Big Data Машинное обучение Hadoop
Data Engineering: концепции, процессы и инструменты 24.07.2023 09:57 kucev 0 Анализ и проектирование систем Data Mining Хранение данных Машинное обучение Data Engineering
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив +3 09.06.2023 07:19 aledovskiy 12 Анализ и проектирование систем Аналитика мобильных приложений Блог компании AvitoTech Python Data Mining Big Data
PySpark для аналитика. Как правильно просить ресурсы и как понять, сколько нужно брать +10 04.05.2023 10:36 aledovskiy 14 Блог компании AvitoTech Python Data Mining Big Data
Проблемы приземления данных из Kafka и их решения на Apache Flink +8 27.04.2023 09:17 olegbunin 0 Блог компании Конференции Олега Бунина (Онтико) Высокая производительность Apache Big Data