• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом pyspark

Что нового в Apache Spark 4.0 +3

  • 01.07.2025 10:30
  • pihel
  • 0
  • Блог компании КОРУС Консалтинг
  • Data Engineering
  • Big Data
  • Apache
  • SQL

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow +5

  • 02.06.2025 11:40
  • tretiakov_dm
  • 0
  • Блог компании Lenta Tech
  • Big Data
  • Data Engineering
  • Data Mining
  • Python

Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2 +4

  • 22.05.2025 13:18
  • VasiliyS178
  • 3
  • Блог компании X5 Tech
  • Python
  • Алгоритмы
  • Хранение данных
  • Data Engineering

Опыт Звука: как реализовать рекомендательную систему аудиокниг с использованием больших языковых моделей (LLM) +5

  • 26.12.2024 10:48
  • Dmitry_Berestnev
  • 1
  • Блог компании HiFi-стриминг Звук
  • Python
  • Машинное обучение
  • Искусственный интеллект
  • Анализ и проектирование систем

Бутстрап в PySpark +7

  • 09.10.2024 09:49
  • ilia_chernikov
  • 2
  • Блог компании X5 Tech
  • Python
  • Статистика в IT
  • Big Data
  • Data Engineering

Оптимизируем Shuffle в Spark

  • 21.08.2024 10:24
  • sergei_smirnov
  • 4
  • Блог компании X5 Tech
  • Big Data
  • IT-компании
  • Data Engineering

Как упаковать бэкенд-код на Go для аналитики на базе Spark

  • 28.06.2024 08:34
  • akhlestin
  • 0
  • Блог компании AvitoTech
  • Go
  • Big Data
  • Hadoop
  • Data Engineering

Как маскировка данных спасает вашу приватность

  • 10.06.2024 07:10
  • neoflex
  • 0
  • Neoflex corporate blog
  • Блог компании Neoflex
  • Python
  • SQL
  • Big Data
  • Data Engineering

Spark. План запросов на примерах

  • 15.04.2024 06:12
  • val6789
  • 4
  • SQL
  • Apache
  • Big Data
  • Хранение данных
  • Data Engineering

Как перезапускать PySpark-приложение и зачем это может понадобиться

  • 04.04.2024 08:46
  • Sber
  • 10
  • Сбер corporate blog
  • High performance
  • Блог компании Сбер
  • Высокая производительность
  • Python
  • Apache

Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди +12

  • 07.11.2023 10:53
  • vladislav_shevchenko
  • 7
  • Блог компании Альфа-Банк
  • Apache
  • Big Data
  • DevOps
  • Data Engineering

Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI +8

  • 06.10.2023 09:00
  • aledovskiy
  • 0
  • Блог компании AvitoTech
  • Python
  • Data Mining
  • Big Data

Feature engineering и кластерный анализ клиентов на PySpark -1

  • 04.10.2023 05:43
  • NewTechAudit
  • 3
  • Big Data
  • Машинное обучение

Пять подходов к созданию ad-hoc-датафреймов в PySpark +10

  • 13.09.2023 12:35
  • NigrumKross
  • 0
  • DevOps
  • Kubernetes
  • Блог компании VK
  • Облачные вычисления
  • Apache
  • Data Engineering

Деревья решений в pySpark: от семечка до параметрической оптимизации случайного леса

  • 12.09.2023 09:45
  • NewTechAudit
  • 0
  • Python
  • Машинное обучение
  • «
  • 1
  • 2
  • 3
  • »
Страница 1 из 3
ЛУЧШЕЕ

  • Вчера
  • Позавчера
06:16

Почему я больше никогда не буду Team-Lead и тебе не советую +115

07:05

Китайский интернет куда-то исчезает +73

09:56

Структурки для ошкурки от ВТБ: как потерять 14 млн руб. на «сверхнадежных облигациях» всего за неделю +51

13:01

3D-моделирование из бумаги +41

15:32

Я отклоняю комиты с использованием кучи и прошу коллег переписать такую логику +36

09:01

Легендарные костыли в продакшене +29

08:01

Полный айсберг Android. Часть 1 +27

00:48

«Очумелые ручки» или собираем держатель для смартфона с клавиатурой и тачпадом из доступных средств +25

07:00

Как мы делаем ВКС в Яндексе, часть 2: это волшебное слово — эксплуатация +15

13:30

Часть 1. Rsync: подробное руководство для админов +14

12:14

Топ-12 бесплатных нейросетей для создания видео и оживления картинок +14

08:00

Искусственный интеллект в разработке: изучаем тренды и реальное применение +13

07:30

Топ-6 Python-библиотек для визуализации +13

05:15

Как я шахматного бота писал +13

12:18

История создания Tarantool DB: реальные проблемы, удачные решения и превращение проекта в продукт +12

12:18

История создания Tarantool DB: реальные проблемы, удачные решения и превращение проекта в продукт +12

09:10

Главный эффект Манделы в мире программистов — сколько байт в мегабайте +12

14:29

Lens Blur Fields: нейросетевая ФРТ на службе улучшения фотографий и идентификации камеры +10

13:34

Хороший, плохой, злой. О чём мы забываем, работая с клиентами? +10

09:01

USDe — стейблкойн, который ничем не обеспечен? +10

05:41

Одноразовый вейп в качестве веб-сервера +168

03:25

Что если представить habr в виде obsidian-графа? +77

14:01

Коллекция полезных HTML и CSS фич, которые редко используются +57

13:45

Ростелеком обнаружил переплаты за свет на сотни миллионов рублей +47

09:05

7 SQL-запросов, которые решают 90% всех задач на работе +39

07:01

Что происходило с новым законом про ЦОДы — мы нашли, кто смог подробно всё это объяснить +39

08:00

GPU, диски, серверы — что ещё анонсировали вендоры в августе. Железный дайджест Selectel +38

09:02

Как взломать и разрушить АЭС за 49 минут: разбор кибератаки на ядерный реактор +36

11:28

Как мы видеокарту AMD на ПЛИС с RISC-V и Linux запускали +35

00:08

Не XP единой — почему Windows 2000 была настоящим шедевром Microsoft +33

10:30

Оценка сроков выполнения задач: покоряем закон Хофштадтера +30

06:59

Как я научил Jetpack Compose показывать рекомпозиции в реальном времени +29

19:50

Что выяснили про ChatGPT: первые реальные данные несколько удивляют +28

12:24

Я хотел пошпионить за своим псом, а в результате проследил за TP-Link +27

12:00

Полный гайд по экономии в облаке Selectel: 3 инструмента, 5 практических сценариев, шпаргалка +26

09:06

Гений Пифагора: почему в рекурсивно-вычисляемом клеточном автомате Вселенной наше сознание бессмертно? +23

14:17

У нас было 10k метрик, 500 А/В-экспериментов и 500kk p-value каждый день… +21

13:24

Распродажа в издательстве «Питер» +20

09:32

Как избавиться от проприетарных ETL: кейс миграции на dbt +20

05:42

Возвращение LTS: ты не пройдёшь… мимо новых фич Java 25 +20

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.