• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом pyspark

4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков +4

  • 16.04.2026 08:30
  • Ko3lof
  • 0
  • Блог компании Mindbox
  • Data Engineering

Как я обрабатываю 15 миллионов GPS-пингов в день для системы транспортной аналитики Ташкента +17

  • 05.04.2026 15:16
  • root_ogg
  • 6
  • Data Engineering
  • Big Data
  • Геоинформационные сервисы

Продвинутый анализ на PySpark: учимся работать с рекуррентными соотношениями +1

  • 10.10.2025 08:08
  • D3vAlex
  • 2
  • Блог компании Axenix (ex-Accenture)
  • Big Data
  • Data Engineering
  • Python

Что нового в Apache Spark 4.0 +3

  • 01.07.2025 10:30
  • pihel
  • 0
  • Блог компании КОРУС Консалтинг
  • Data Engineering
  • Big Data
  • Apache
  • SQL

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow +5

  • 02.06.2025 11:40
  • tretiakov_dm
  • 0
  • Блог компании Lenta Tech
  • Big Data
  • Data Engineering
  • Data Mining
  • Python

Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2 +4

  • 22.05.2025 13:18
  • VasiliyS178
  • 3
  • Блог компании X5 Tech
  • Python
  • Алгоритмы
  • Хранение данных
  • Data Engineering

Опыт Звука: как реализовать рекомендательную систему аудиокниг с использованием больших языковых моделей (LLM) +5

  • 26.12.2024 10:48
  • Dmitry_Berestnev
  • 1
  • Блог компании HiFi-стриминг Звук
  • Python
  • Машинное обучение
  • Искусственный интеллект
  • Анализ и проектирование систем

Бутстрап в PySpark +7

  • 09.10.2024 09:49
  • ilia_chernikov
  • 2
  • Блог компании X5 Tech
  • Python
  • Статистика в IT
  • Big Data
  • Data Engineering

Оптимизируем Shuffle в Spark

  • 21.08.2024 10:24
  • sergei_smirnov
  • 4
  • Блог компании X5 Tech
  • Big Data
  • IT-компании
  • Data Engineering

Как упаковать бэкенд-код на Go для аналитики на базе Spark

  • 28.06.2024 08:34
  • akhlestin
  • 0
  • Блог компании AvitoTech
  • Go
  • Big Data
  • Hadoop
  • Data Engineering

Как маскировка данных спасает вашу приватность

  • 10.06.2024 07:10
  • neoflex
  • 0
  • Neoflex corporate blog
  • Блог компании Neoflex
  • Python
  • SQL
  • Big Data
  • Data Engineering

Spark. План запросов на примерах

  • 15.04.2024 06:12
  • val6789
  • 4
  • SQL
  • Apache
  • Big Data
  • Хранение данных
  • Data Engineering

Как перезапускать PySpark-приложение и зачем это может понадобиться

  • 04.04.2024 08:46
  • Sber
  • 10
  • Сбер corporate blog
  • High performance
  • Блог компании Сбер
  • Высокая производительность
  • Python
  • Apache

Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди +12

  • 07.11.2023 10:53
  • vladislav_shevchenko
  • 7
  • Блог компании Альфа-Банк
  • Apache
  • Big Data
  • DevOps
  • Data Engineering

Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI +8

  • 06.10.2023 09:00
  • aledovskiy
  • 0
  • Блог компании AvitoTech
  • Python
  • Data Mining
  • Big Data
  • «
  • 1
  • 2
  • 3
  • »
Страница 1 из 3
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
07:32

Это — всё что вам надо знать о белых списках: как устроены и 6 рабочих способов обхода +249

09:01

Почему не взлетели дирижабли? Часть 19: советские дирижабли накануне войны +31

02:32

Yggdrasil-ng: как я переписал Yggdrasil на Rust за 3.5 дня и неделю фиксил один баг +22

13:16

Опасный ток: как плакаты и карикатуры поддерживали страх и что за ним стояло +16

13:01

Я проверил Wi-Fi 7 на практике: 3+ Гбит/сек по воздуху и нюансы +16

07:25

Что тренд грядущий нам готовит: как Netflix меняет правила игры в киноиндустрии на примере отчета Still Watching 2025 +14

12:05

Лучший промпт для LLM. Бессмысленный поиск +12

06:11

Локальные LLM на слабом железе — что ставить, как запустить, чего ждать +12

15:06

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3 +11

08:00

Пять одноплатников 2026: новые чипы, больше памяти и неожиданные форматы +10

07:48

Накануне ввода «реестра криптанов» в РФ, давайте обратимся к французскому опыту +10

13:35

Kotlin — моя любовь, Java — моя судьба. История одного возвращения +9

13:30

IT: от сокращения до оффера. Полезные заметки на полях +9

16:02

Квантовый сапёр и квантовый тетрис: изучение квантовых феноменов через компьютерные игры +7

14:40

Пять неочевидных вещей, которые я узнал, запуская кино-соцсеть: от robots.txt-ловушки до 24-мерной математики вкуса +7

00:03

От регулярок к ANTLR4: три архитектурных решения на парсере бизнес-формул +7

13:42

Почему у тиранозавра маленькие ручки? +6

17:45

StaticECS — Bitmap Entity Component System +5

14:16

О создании в России центральной базы данных идентификаторов пользовательского оборудования (оконечного оборудования) +5

08:06

Как научить кодинг-модели не переписывать код заново +5

09:28

Глухарь ESPшный — мемуары охотника +119

08:06

Тренд на деградацию: как я написал прокси-шакализатор на Next.js, чтобы помочь замедлить интернет +83

09:01

Ваш RAG не умеет думать. А мой умеет +71

07:01

Кустарные вакуумные триоды Клода Пайяра. Часть 6. Приспособления, оснастка +45

11:40

Реализация автоудаления блокирующих сессий в MS SQL +30

13:01

Золотой стандарт оптимизации: разбираем реализацию RollerCoaster Tycoon +29

17:52

Как работать с DDR4 +26

08:05

КД-6. Конференц-телефон советской эпохи +26

16:46

Права в Linux: chown/chmod, SELinux context, символьная/восьмеричная нотация, DAC/MAC/RBAC/ABAC +25

13:15

Вторая жизнь старого смартфона в качестве домашнего сервера +25

08:00

Ленты коротких видео: как оптимизировать, чтобы вас смотрели больше +25

19:56

Воскрешение NumLockCalc после 17 лет забвения +23

00:33

«Трубы» зовут — вспоминаем историю скринсейверов +23

07:50

Сапборд с мотором и немного о физике +22

13:14

Сравнительный анализ RISC-V микропроцессоров picorv32 и scr1 при использовании в FPGA +21

09:15

Книга «Изучаем DDD — предметно-ориентированное проектирование». Подробный читательский обзор +17

07:05

О технологиях домашнего производства пластиковых/металлических деталей +17

12:13

Как СМИ рождают “хакеров” и как сам Глава группировки слил секретные методы DDoS +16

08:00

Как подключить Kafka UI к кластеру Kafka в DBaaS +16

09:14

Первое решение суда поразило всех, но второе оказалось еще хлеще: иск на 766 000 000 ₽ за надпись «Я люблю свою семью» +15

05:38

TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове +152

22:13

Выжать больше из локальных LLM. Ollama медленнее llama.cpp в 3 раза. UD_Q4_K_XL лучше чем Q4_K_M, а вес тот же и т.д +146

11:07

Что на самом деле происходит в комнате с пирамидками и почему после неё не верят даташитам на микросхемы +54

15:22

Вы еще спрашиваете, почему все ненавидят рекрутеров? +48

12:04

Тихий перфоратор для соседа: как спроектировать тактовый генератор с распределенным спектром +45

13:01

АПаем возможности паять: переход на новый паяльник +43

09:01

Редкий китайский суперстрат Vorson TS-K-6 +42

12:00

Возвращение испанской барахолки: аудиосистемы, интернет по проводке, баян и кое-что еще +33

08:01

OpenSearch Dashboards и как веб‑интерфейс упрощает работу с кластером +33

14:27

Вот как сегодня устроено российское производство +30

14:55

Есть ли жизнь после Cisco ISE? Распаковка и тест-драйв российского NAC от Eltex в сетевой лаборатории +26

07:05

Дело 2005г.: Sony BMG против собственных покупателей или как защита от пиратства превратилась в руткит +26

11:41

Чит-код для ИТ-карьеры: как рецензирование книг помогает проходить собесы в бигтех и прокачивать личный бренд +23

08:50

Как дообучать локальные LLM в 2026 году: практическое руководство +22

09:49

Я устал каждый раз гуглить одно и то же в nginx — и сделал инструмент, который объясняет конфиги на русском +21

05:35

Обзор релиза Kubernetes 1.36: перестаём пересобирать образы, чистим «зомби» PVC и читаем логи без SSH. Разбор 68 фич +20

14:05

Intl: мощный браузерный API, который вы, возможно, не используете +17

14:15

Подводные камни распараллеливания автотестов +16

14:00

AutoML для NLU без ручной настройки: делимся библиотекой OpenAutoNLU +16

14:00

AutoML для NLU без ручной настройки: делимся библиотекой OpenAutoNLU +16

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Зачем ИТ-специалисту семья, или как не потерять себя на работе и в разврате? -10

    • 440

    Покупатель попросил готовить дом к его приезду и приносить ему еду. Тогда я понял, за что берут 900 тысяч за сотку +15

    • 162

    TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове +152

    • 101

    Вы еще спрашиваете, почему все ненавидят рекрутеров? +48

    • 91

    Выжать больше из локальных LLM. Ollama медленнее llama.cpp в 3 раза. UD_Q4_K_XL лучше чем Q4_K_M, а вес тот же и т.д +146

    • 78

    Это — всё что вам надо знать о белых списках: как устроены и 6 рабочих способов обхода +249

    • 64

    Сапборд с мотором и немного о физике +22

    • 63

    АПаем возможности паять: переход на новый паяльник +43

    • 58

    Вторая жизнь старого смартфона в качестве домашнего сервера +25

    • 56

    Что на самом деле происходит в комнате с пирамидками и почему после неё не верят даташитам на микросхемы +54

    • 54

    Способы достижения технологической независимости в области ЭВМ +2

    • 50

    «Трубы» зовут — вспоминаем историю скринсейверов +23

    • 44

    Глухарь ESPшный — мемуары охотника +119

    • 43

    Воскрешение NumLockCalc после 17 лет забвения +23

    • 37

    Даже гениям отказывают -6

    • 37

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.