Опыт Звука: как реализовать рекомендательную систему аудиокниг с использованием больших языковых моделей (LLM) +5 26.12.2024 10:48 Dmitry_Berestnev 1 Блог компании HiFi-стриминг Звук Python Машинное обучение Искусственный интеллект Анализ и проектирование систем
Бутстрап в PySpark +7 09.10.2024 09:49 ilia_chernikov 2 Блог компании X5 Tech Python Статистика в IT Big Data Data Engineering
Оптимизируем Shuffle в Spark 21.08.2024 10:24 sergei_smirnov 4 Блог компании X5 Tech Big Data IT-компании Data Engineering
Как упаковать бэкенд-код на Go для аналитики на базе Spark 28.06.2024 08:34 akhlestin 0 Блог компании AvitoTech Go Big Data Hadoop Data Engineering
Как маскировка данных спасает вашу приватность 10.06.2024 07:10 neoflex 0 Neoflex corporate blog Блог компании Neoflex Python SQL Big Data Data Engineering
Spark. План запросов на примерах 15.04.2024 06:12 val6789 4 SQL Apache Big Data Хранение данных Data Engineering
Как перезапускать PySpark-приложение и зачем это может понадобиться 04.04.2024 08:46 Sber 10 Сбер corporate blog High performance Блог компании Сбер Высокая производительность Python Apache
Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди +12 07.11.2023 10:53 vladislav_shevchenko 7 Блог компании Альфа-Банк Apache Big Data DevOps Data Engineering
Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI +8 06.10.2023 09:00 aledovskiy 0 Блог компании AvitoTech Python Data Mining Big Data
Feature engineering и кластерный анализ клиентов на PySpark -1 04.10.2023 05:43 NewTechAudit 3 Big Data Машинное обучение
Пять подходов к созданию ad-hoc-датафреймов в PySpark +10 13.09.2023 12:35 NigrumKross 0 DevOps Kubernetes Блог компании VK Облачные вычисления Apache Data Engineering
Деревья решений в pySpark: от семечка до параметрической оптимизации случайного леса 12.09.2023 09:45 NewTechAudit 0 Python Машинное обучение
Стайлгайд PySpark: как сделать код элегантным +10 12.09.2023 08:06 NigrumKross 1 Kubernetes Блог компании VK Python Облачные вычисления Apache DevOps
Стайлгайд PySpark: как сделать код элегантным +11 08.09.2023 10:16 waltherman 1 VK corporate blog Cloud computing Блог компании VK Облачные вычисления Apache DevOps Kubernetes
Обработка больших и очень больших графов: Pregel +3 15.08.2023 03:06 neshkeev 2 Algorithms Distributed systems Алгоритмы Apache Распределённые системы