Разгоняем REACTOR / forpes.ru

Главная
Разгоняем REACTOR

Разгоняем REACTOR +6

12.06.2021 13:56

EatingPeopleIsFun 29 2400 Источник

Кому будет интересно?

Реактор сегодня - это стильно, модно, молодежно. Почему многие из нас практикуют реактивное программирование? Мало кто может ответить однозначно на этот вопрос. Хорошо - если Вы понимаете свой выигрыш, плохо - если реактор навязан организацией как данность. Большинство аргументов "ЗА" - это использование микросервисной архитектуры, которая в свою очередь обязывает микросервисы часто и много коммуницировать между собой. Для коммуникации в большинстве случаев выбирают HTTP взаимодействие. Для HTTP нужен легковесный веб-сервер, а что первое приходит на ум? Tomcat. Тут появляются проблемы с лимитом на максимальное количество сессий, при превышении которого веб-сервер начинает реджектить запросы (хотя лимита этого не так уж и легко достичь). Здесь на подмогу приходит реактор, который подобными лимитами не ограничен, и, например, Netty в качестве веб-сервера, который работает с реактивностью из коробки. Раз есть реактивный веб-сервер, нужен реактивный веб-клиент (Spring WebClient или Reactive Feign), а раз клиент реактивный, то вся эта жуть просачивается в бизнес логику, Mono и Flux становятся Вашими лучшими друзьями (хотя по началу есть только ненависть :))

Среди бизнес задач, очень часто встречаются серьезные процедуры, которые обрабатывают большие массивы данных, и нам приходится применять реактор и для них. Тут начинаются сюрпризы, если реактор не уметь готовить, можно и проблем схлопотать очень много. Превышение лимита файловых дескрипторов на сервере, OutOfMemory из-за неконтролируемой скорости работы неблокирующего кода и многое многое другое, о чем мы сегодня поговорим. Мы с коллегами испытали очень много трудностей из-за проблем с пониманием как держать реактор под контролем, но всё что нас не убивает - делает нас умнее!

Блокирующий и неблокирующий код

Вы ничего не поймете дальше, если не будете понимать разницу между блокирующим и неблокирующим кодом. Поэтому, остановимся и внимательно разберемся в чем разница. Вы уже знаете, блокирующий код реактору - враг, неблокирующий - бро. Проблема лишь в том, что в настоящий момент времени, не все взаимодействия имеют неблокирующие аналоги.

Лидер здесь - HTTP взаимодействие, вариантов масса, выбирай любой. Я предпочитаю Reactive Feign от Playtika, в комбинации со Spring Boot + WebFlux + Eureka мы получаем очень годную сборку для микросервисной архитектуры.

Давайте по-простому: НЕблокирующий код, это обычно всё, в названии чего есть reactive, а блокирующий - все оставшееся :) Hibernate + PostgreSQL - блокирующий, отправить почту через JavaMail - блокирующий, скинуть сообщение в очередь IBMMQ - блокирующий. Но есть, например, реактивный драйвер для MongoDB - неблокирующий. Отличительной особенностью блокирующего кода, является то, что глубоко внутри произойдет вызов метода, который заставит Ваш поток ждать (Thread.sleep() / Socket.read() и многие подобные), что для реактора - как нож в спину. Что же делать? Большинство бизнес логики завязано на базу данных, без нее никуда. На самом деле достаточно знать и уметь делать 2 вещи:

Необходимо понимать где блокирующий код. В этом может помочь проект BlockHound или его аналоги (тут тема для отдельной статьи)
Исполнение блокирующего кода необходимо переключать на пулы, готовые его выполнять, например: Schedulers.boundedElastic(). Делается это при помощи операторов publishOn & subscribeOn

Разгоняемся сами

Перед тем, как продолжить, необходимо немного размяться!

Уровень 1

    @Test
    fun testLevel1() {
        val result = Mono.just("")
            .map { "123" }
            .block()

        assertEquals("123", result)
    }

Начнем с простого, такой код обычно пишут начинающие reactor программисты. Как начать цепочку? Mono.just и ты на коне :) Оператор map трансформирует пустую строку в "123" и оператор block делает subscribe.

Обращаю особенное внимание на оператор block, не поддавайтесь соблазну использовать его в Вашем коде, исключение составляют тесты, где это очень удобно. При вызове block внутри метода Вашего RestController, Вы сразу получите исключение в рантайме.

Уровень 2

    fun nonBlockingMethod1sec(data: String) 
    = data.toMono().delayElement(Duration.ofMillis(1000))

    @Test
    fun testLevel2() {
        val result = nonBlockingMethod1sec("Hello world")
            .flatMap { nonBlockingMethod1sec(it) }
            .block()

        assertEquals("Hello world", result)
    }

Усложняем наш код, добавляем неблокирующий метод nonBlockingMethod1sec, все что он делает - ожидает одну секунду. Все что делает данный код - дважды, по очереди, запускает неблокирующий метод.

Уровень 3

    fun collectTasks() = (0..99)

    @Test
    fun testLevel3() {
        val result = nonBlockingMethod1sec("Hello world")
            .flatMap { businessContext ->
                collectTasks()
                    .toFlux()
                    .map {
                        businessContext + it
                    }
                    .collectList()
            }
            .block()!!

        assertEquals(collectTasks().toList().size, result.size)
    }

Начинаем добавлять самое интересное - Flux! У нас появляется метод collectTasks, который собирает массив из сотни чисел, и далее мы делаем из него Flux - это будет наш список задач. К каждой задаче мы применяем трансформацию через оператор map. Оператор collectList собирает все результаты в итоговый список для дальнейшего использования.

Здесь наш код начинает превращаться в рабочий паттерн, который можно использовать для массового выполнения задач. Сначала мы собираем некий "бизнес контекст", который мы используем в дальнейшем для выполнения задач.

Уровень 4

    fun collectTasks() = (0..100)
    
    @Test
    fun testLevel4() {
        val result = nonBlockingMethod1sec("Hello world")
            .flatMap { businessContext ->
                collectTasks().toFlux()
                    .flatMap {
                        Mono.deferContextual { reactiveContext ->
                            val hash = businessContext + it + reactiveContext["requestId"]
                            hash.toMono()
                        }
                    }.collectList()
            }
            .contextWrite { it.put("requestId", UUID.randomUUID().toString()) }
            .block()!!

        assertEquals(collectTasks().toList().size, result.size)
    }

Добавляем немного плюшек. Появилась запись данных (15) в реактивный контекст, а также чтение (10) из него. Мы почти у цели. Постепенно переходим к итоговому варианту

Уровень 5

    fun collectTasks() = (0..1000)
    
    fun doSomethingNonBlocking(data: String)
        = data.toMono().delayElement(Duration.ofMillis(1000))
    
    fun doSomethingBlocking(data: String): String {
        Thread.sleep(1000); return data
    }

    val pool = Schedulers.newBoundedElastic(10, Int.MAX_VALUE, "test-pool")
    private val logger = getLogger()

    @Test
    fun testLevel5() {
        val counter = AtomicInteger(0)
        val result = nonBlockingMethod1sec("Hello world")
            .flatMap { _ ->
                collectTasks().toFlux()
                    .parallel()
                    .runOn(pool)
                    .flatMap {
                        Mono.deferContextual { _ ->
                            doSomethingNonBlocking(it.toString())
                                .doOnRequest { logger.info("Added task in pool ${counter.incrementAndGet()}") }
                                .doOnNext { logger.info("Non blocking code finished ${counter.get()}") }
                                .map { doSomethingBlocking(it) }
                                .doOnNext { logger.info("Removed task from pool ${counter.decrementAndGet()}") }
                        }
                    }.sequential()
                    .collectList()
            }
            .block()!!

        assertEquals(collectTasks().toList().size, result.size)
    }

Вот мы и добрались до итогового варианта! Часть с реактивным контекстом была опущена для более наглядной демонстрации того, зачем мы здесь собрались. У нас появились два новых метода: doSomethingNonBlocking (3) & doSomethingBlocking (6) - один с неблокирующим ожиданием в секунду, второй с блокирующим. Мы создали пул потоков для обработки задач (10), добавили счетчик активных задач в реакторе (15). У нас появился оператор parallel (19) и обратный ему sequential (29). Задачи мы назначили на свежесозданный пул (20). Для понимания, что же происходит внутри, добавили логирование внутри операторов doOnRequest (вызывается перед исполнением метода), doOnNext (вызывается после исполнения метода). Основная задумка - на примере, определить сколько задач одновременно выполняется в реакторе и за какое время цепочка завершит свою работу.

Такой "паттерн", мы с коллегами очень часто применяем для выполнения сложных задач, таких как отправка отчетов или массовая обработка транзакций. Первым делом собирается бизнес контекст - это некая структура, содержащая в себе информацию, полученную в результате вызовов других микросервисов. Бизнес контекст необходим нам для выполнения самих задач, и собирается он заранее, чтобы не тратить время в процессе обработки. Далее мы собираем список задач, превращаем их во Flux и скармливаем реактору на параллельную обработку.

И вот здесь начинается самое интересное. Попробуйте ответить на несколько вопросов. Как Вы считаете, сколько времени будет выполнятся данная цепочка? В ней 100 задач, в каждой задаче неблокирующее ожидание в 1 секунду, блокирующее ожидание в 1 секунду, и у нас в наличии пул из 10 потоков? (Вполне годная задачка на собеседование senior reactor developer :))

Правильный ответ

Около 12 секунд. Рассуждаем от блокирующего :) Блокирующее ожидание никуда не деть, и тут имеем 100 блокирующих секунд на 10 потоков, итого 10 секунд. Неблокирующее ожидание заметно нам лишь в первый раз, далее оно незаметно запускается в передышках между блокирующим. Не забываем про одну секунду сбора "бизнес контекста" перед запуском задач.

А теперь уберем строку (26) .map { doSomethingBlocking(it) } . Освободим наш реактор от блокирующего кода, интересно, сколько теперь времени займет выполнение цепочки?

Правильный ответ

2 секунды! 1 на сбор "бизнес контекста" и 1 на выполнение всех задач. Реактор запустит 100 задач одновременно. Но ведь у нас пул из 10 потоков? Как так? Первый разрыв шаблона.

Мы идем до конца и увеличиваем количество задач в методе collectTasks() до ... 1000? а может быть сразу до 15000? Как долго реактор будет выполнять столько задач?

Правильный ответ

2 секунды! 1 на сбор "бизнес контекста" и 1 на выполнение всех задач. Реактор запустит ВСЕ задачи одновременно. Второй разрыв шаблона. Где предел?

А это вообще легально?

Как же так и как это контролировать? Почему это опасно? Что если внутри параллельной обработки Вы решите вызвать другой микросервис? Если у вас 30000 задач, и по завершению каждой, Вам нужно отправлять запрос соседнему микросервису, Вы с удивлением можете обнаружить, что реактор непременно постарается выполнить все вызовы одновременно (Вы ведь используете реактивный web-client или реактивный feign, верно?) Открытие такого большого количества сокетов повлечет за собой превышение лимита открытых файловых дескрипторов в системе, что как минимум создаст проблемы с невозможностью создания новых сокетов в системе и помешает другим сервисам, а как максимум повалит Вам на сервере SSH и Вы потеряете доступ к серверу. Сомневаюсь, что в этот момент, программист будет кричать "зато смотри как быстро работает".

Разрыв шаблона. Thread Pool & Reactor

Основная проблема начинающего реактор программиста - это образ мышления, если есть медленный процесс - добавь X потоков, будет быстрее в X раз, а если слишком быстро - сократи количество потоков. Как всё просто было раньше? :) С реактором это не работает.

Классический thread pool - двери. Больше дверей - больше пропускная способность, все работает быстрее.

Теперь встречайте reactor! Вы видите двери? Нет никаких дверей

Реактор это большой мешок с подарками, или воздушная труба, задачи в которую валятся и летают там пока не выполнятся. А кто эти люди в желтом? Это наши epoll реактивные потоки, которые ни в коем случае нельзя нагружать блокирующими задачами. Можно провести аналогию с прорабами или инженерами. Они здесь, чтобы управлять процессом, а не чтобы выполнять тяжелую работу. Займите одного инженера тяжелой задачей, и когда к нему придет следующий рабочий с вопросом "что делать дальше?", он не сможет ответить, потому что был занят. Вот так и появляются таймауты в реактивном коде. Казалось бы микросервис стоит без нагрузки, выполняет какие-то задачки, а один из 500 запросов к нему падает с тайм-аутом, и непонятно почему. Велика вероятность что инженер был занят блокирующей задачей! Заботьтесь о своих инженерах и поручайте тяжелую работу специально обученным рабочим, например, Schedulers.boundedElastic().

Как контролировать эту "трубу", в которую валится всё без контроля? Вот мы и подошли к кульминации

Конфигурируем реактор!

В своей дефолтной конфигурации, параллельная обработка в реакторе зависит от количества ядер процессора сервера, на котором запускается код, поэтому, к своему удивлению, Вы получите разные результаты, проверяя работу реактора в тесте на локальной машине с 4-8 ядрами и production сервере с 32 ядрами.

Парад настроек открывает parallel с его аргументом parallelism

Меняя parallelism, мы можем регулировать количество запускаемых rails (это местное понятие реактора, которое похоже на корутины, но по сути является количеством одновременно выполняемых неблокирующих задач). Prefetch мы рассмотрим более подробно в следующем разделе.

Но одного parallelism недостаточно, реактор все еще будет нагребать задач как не в себя.

Мало кто обращал внимание что у оператора flatMap (только того что запускается на Flux) есть перегрузки с интересными аргументами, а именно maxConcurrency

maxConcurrency очень важен, по дефолту значение стоит Integer.MAX_VALUE (определяет сколько неблокирующих задач может выполняться одновременно на одной рельсе. Понимаете теперь откуда аппетит у реактора?

Также, не стоит забывать, что если цепочка будет запущена несколько раз (вызов одного http метода контроллера несколько раз), то все помножится! Никакой пул не спасет.

Количество запусков цепочки напрямую влияет на количество одновременно выполняемых задач.

Подведем небольшой итог:

parallel (parallelism)
flatMap (maxConcurrency)
Количество запусков цепочки

Эти три параметра являются множителями, для расчета количества одновременных задач.

По дефолту это Кол-во ядер * Integer.MAX_VALUE * Количество запусков цепочки

Напротив же, запустив данный код для 5 задач длительностью в секунду мы получим цепочку работающую 5 секунд. Теперь всё под контролем!

        val result = nonBlockingMethod1sec("Hello world")
            .flatMap { _ ->
                collectTasks().toFlux()
                    .parallel(1)
                    .runOn(pool, 1)
                    .flatMap({
                        Mono.deferContextual { _ ->
                            doSomethingNonBlocking(it.toString())
                        }
                    }, false, 1, 1)
                    .sequential()
                    .collectList()
            }
            .block()!!

Стоп, или не всё?

Thread Pool

Зачем же нужен пул потоков в реакторе? Думайте о нем как о двигателе для Вашего автомобиля. Чем пул мощнее - тем блокирующие задачи будут разбираться быстрее, а если потоков мало, то и блокирующие задачи задержатся у вас надолго! А куда же мы без блокирующих вызовов? На количество одновременно выполняемых задач в реакторе он не влияет, вот это поворот :)

Надеюсь, Вы не пробовали использовать Schedulers.parallel() для исполнения Вашего блокирующего кода? =) Несмотря на свое подходящее название ~~(ну называется он parallel, значит и нужен для параллельной обработки)~~ использовать этот пул можно только для неблокирующего кода, в доке указано что он живет с одним воркером, и содержит в себе только особенные, реактивные потоки.

Распределение задач по рельсам

Не коснулись мы еще одной важной темы. Обычно, мы пытаемся закончить обработку большого массива данных в кратчайший срок, с чем нам определенно поможет изложенный выше материал, но это еще не все. В тестах мы часто используем синтетические данные, которые генерируем одинаковыми порциями, исключая погрешности production среды. Задачи обычно выполняются разное время и это создает проблемы с равномерным распределением задач.

Зеленые прямоугольники это наши задачи, которые распределяются в реакторе по алгоритму round-robin, что в случае с синтетическими данными дает красивую картинку.

Хорошо загруженный реактор (задачи равномерно распределены).
54 блокирующих задачи (каждая по 1сек),? round-robin распределение по 6 рельсам — Хорошо загруженный реактор (задачи равномерно распределены). 54 блокирующих задачи (каждая по 1сек),? round-robin распределение по 6 рельсам

Но запуская код в production среде, мы можем встретиться с долгим запросом в базу, сетевыми задержками, плохим настроением микросервиса да и чего только не бывает.

Плохо загруженный пул (задачи распределены не равномерно)
54 блокирующих задачи (каждая по 1сек кроме 2ух),? round-robin распределение по 6 рельсам — Плохо загруженный пул (задачи распределены не равномерно) 54 блокирующих задачи (каждая по 1сек кроме 2ух),? round-robin распределение по 6 рельсам

Оператор collectList() вернет нам результат только после завершения последней задачи, и как мы видим, наш пул будет простаивать пока 1 поток трудится разгребая очередь накопившихся задач. Это создает неприятные задержки, когда Вы знаете что можно быстрее, но быстрее не происходит.

Бороться с этим можно несколькими способами

concatMap вместо flatMap (посмотрите в профилировщик на ваш пул, передумаете)
правильно планировать задачи, чтобы исключить аномалии (почти невозможно)
дробить каждую задачу на много мелких, и также запускать их в параллельную обработку чтобы нивелировать проблемы с распределением (вполне рабочий вариант)
prefetch (наш выбор!)

Параметр prefetch у flatMap & runOn позволяет определить, сколько задач будет взято на одну рельсу на старте, а затем при достижении некоторого порога выполнения задач, реквесты будут повторяться с этим количеством. Значение по умолчанию - 256. Сменив значение на 1, можно заставить реактор использовать механизм "work stealing", при котором, рельсы и потоки, которые освободились, будут забирать задачи себе на выполнение и картина получится гораздо более приятная.

Хорошо загруженный пул (задачи равномерно распределены)
54 блокирующих задачи (каждая по 1сек кроме 2ух),? round-robin распределение по 6 рельсам
Prefetch ! — Хорошо загруженный пул (задачи равномерно распределены) 54 блокирующих задачи (каждая по 1сек кроме 2ух),? round-robin распределение по 6 рельсам Prefetch !

На этом у меня всё. Будет интересно прочесть Ваши замечания и комментарии, на 100% истину не претендую, но все результаты подкреплены практическими примерами, на Spring Boot + Project Reactor 3.4. Всем спасибо!

Комментарии (29)

raamid
12.06.2021 19:03
#23143518
К картинке с реактором так и напрашивается подпись (извините не сдержался):
— Вот туда я лопатку уронил!

sergey-b
12.06.2021 21:02
#23143752
Я что-то не понял трюк со счетчиком.
1. В onRequest делаем increment()
2. В onNext делаем get()
Что нам дает get()? Он же может выдать любое значение, в зависимости от того, какие звезды сойдутся.
1. EatingPeopleIsFun Автор
  12.06.2021 21:41
  #23143852
  Дает текущее значение счетчика, которое будет равно количеству одновременно существующих (параллельных) задач в реакторе на конкретный момент когда был сделан get(), удобно мониторить текущее состояние

rjhdby
12.06.2021 23:54
#23144054
+2
Реактор — прекрасная концепция. На нём суперски писать новые сервисы с нуля. А потом увольняться, чтобы не дай бог не успели придти с предложением где-нибудь посередине чуть-чуть поменять бизнес-логику.
1. EatingPeopleIsFun Автор
  13.06.2021 00:00
  #23144070
  +2
  Осмелюсь возразить, в настоящий момент успешно разрабатываем и поддерживаем 40 микросервисов в проекте :) Spring Boot + Kotlin + Reactor, новые разработчики проходят стадию отрицания при знакомстве с реактором, но потом всем начинает нравиться, когда понимают как его правильно готовить. Проводим периодические семинары и обучение внутри команды.

BugM
13.06.2021 01:20
#23144228
А зачем все это? Чтобы потешить самолюбие и написать write only код это понятно. А кроме этого зачем?

Типичный сервис по перекладываюнию джейсонов:

Получаем запрос от пользователя.
Пишем-читаем несколько БД или внешних сервисов.
Отдаем результат пользователю.

Подавляющую часть времени этот сервис проводит в вызовах внешних сервисов, а сам ничего не делает. Даем пул побольше и проблема паралельности входящих запросов решена. (не надо прямо так в лоб делать сервисы для миллиона рпс. а вот для тысячи вполне можно)
Дальше надо ускорить ответ пользователю. Паралелим вызовы внешних БД/сервисов там где это можно.
Все. Если код написан более-менее нормально то у нас производительность максимальна для данной архитектуры, нагрузку держим максимальную для данных ядер.

И этот код можно читать и поддерживать без боли. Все понятно и просто. И зачем тут городить все что вы предлагаете? Оно сложно, неочевидно и вызывает проблемы при попытке хотя бы прочитать ваш код.
1. EatingPeopleIsFun Автор
  13.06.2021 01:51
  #23144250
  Вечер добрый, конкретно мы, используем реактор, потому что перед нами стоит задача по разработке системы, которая обрабатывает десятки миллионов транзакций в день, десятки тысяч отчетов, платежных документов и всего сопутствующего. Я не агитирую всех и каждого начать использовать реактор по любому поводу и без. В этой статье я описал ряд проблем и решений, с которыми мы сталкивались и боролись в нашей команде. Надеюсь это сэкономит время и силы другим разработчикам. Реактор позволяет бережно использовать потоки, из коробки дает некоторые интересные возможности, retry / backpressure / cancel обработчики и т.п. Удачно подходит для микросервисной архитектуры. Код кажется write-only, нечитаемым, одноразовым, потому что здесь происходит смена парадигмы программирования. Императивное -> Функциональное -> Реактивное. Для тех кто работает с реактором достаточное количество времени, все выглядит вполне "maintainable".
  Вот небольшая цитата, достаточно полно описывающая зачем нужно реактивное программирование.
  Compared to traditional imperative and functional programming, reactive programming requires a mindset-shift in order to apply the concepts and techniques effectively. The benefits we gain support us in some key challenges that every engineer is facing with essentially every (micro-) service in today’s backend architectures: handling of blocking IO, backpressure, managing highly varying loads as well as message and error propagation.
  1. BugM
    13.06.2021 02:26
    #23144292
    -1
    А зачем вы экономите потоки? Есть фонд какой-то который их собирает или что?
    Типичные 500-1000, да даже 5000 потоков Джава переваривает достаточно спокойно. Куда вам больше?
    
    Типичные ретраи для Джавы это пара классов которые при необходимости спокойно пишутся за пару дней. Там нет ничего сложного. В любом проекте я думаю уже есть.
    
    Императивное -> Функциональное -> Реактивное
    
    Это так не работает. Даже более менее чистое функциональное программирование массово не нужно оказалось. Элементы и куски — да, очень удобно. Но не более того.
    
    А Реактор с 5 летней историей вообще никак не взлетает. Срок вполне достаточный.
    
    EatingPeopleIsFun Автор
    13.06.2021 02:55
    #23144314
    +1
    Если стоит вопрос, экономить ресурсы или нет, я обычно выбираю экономить. В своей практике периодически сталкиваюсь с OOM, и в долгосрочной перспективе выбираю оптимизацию и рефакторинг вместо "завалить железом". Не считаю удачной идеей в 5000 потоков опрашивать микросервисы, когда могу сделать это с помощью 1. Не считаю удачной идеей открывать 5000 коннектов к базе. Считаю что разработчик должен полностью контролировать ресурсы, которые использует его приложение. Создание потока, операция затратная, также существует понятие context switch. Сталкивался с ситуациями когда при большой нагрузке веб-сервер начинает реджектить запросы, упирается в лимиты сессий. Сталкивался с ситуациями когда система теряет стабильность из-за того что один микросервис выходит из под контроля, превышая разумные рамки по созданию файловых дескрипторов. Считаю что если приложение работает используя 5000 потоков, или даже 1000 потоков, то с ним что-то не в порядке, пока в своем опыте не встречал необходимости так тратить ресурсы.
    Реактор развивается и обновляется, не вижу с этим каких-либо проблем. Возможно, он не взлетает в Ваших проектах, у нас взлетел.
    
    BugM
    13.06.2021 14:31
    #23144978
    Если стоит вопрос, экономить ресурсы или нет, я обычно выбираю экономить. В своей практике периодически сталкиваюсь с OOM, и в долгосрочной перспективе выбираю оптимизацию и рефакторинг вместо «завалить железом».
    
    Конечно, ресурсы экономить надо. ЦПУ, РАМ. Они денег стоят.
    А потоки здесь при чем? Поток для себя забирает примерно 16кб памяти. 5000 потоков заберут примерно 80 мегабайт. Столько потоков бывает в хм большом и нагруженном микросервисе. Там 80 мегабайт на фоне общего потребления потеряются.
    
    Не считаю удачной идеей открывать 5000 коннектов к базе.
    
    Конечно, поэтому придумали пулы.
    
    Создание потока, операция затратная, также существует понятие context switch.
    
    И тут тоже пулы. Временем на context switch можно пренебречь если нормально написать код. В другой потом надо отдавать что-то занимающее не нулевое время. И тогда оверхед будет почти нулевой.
    
    Считаю что если приложение работает используя 5000 потоков, или даже 1000 потоков, то с ним что-то не в порядке, пока в своем опыте не встречал необходимости так тратить ресурсы.
    
    Возьмем популярный веб сервер jetty. У него поток на каждого клиента. Сотни выбираются сразу. До тысячи добраться легко.
    Вы считаете что с разработчиками jetty что-то не в порядке, они не умеют считать ресурсы и написали код неоптимально?
    
    Реактор развивается и обновляется, не вижу с этим каких-либо проблем. Возможно, он не взлетает в Ваших проектах, у нас взлетел.
    
    Он в мире не взлетает. Процент использования в больших проектах что-то около нуля.
    
    SimSonic
    13.06.2021 19:44
    #23145510
    Какие-то странные у Вас потоки, по 16 кб. А стек по умолчанию на 1 мб/поток?
    
    BugM
    13.06.2021 19:49
    #23145530
    Вы все еще сидите на jdk8? Сочуствую, но пора обновляться.
    В jdk11 уже нет никакого мегабайта.
    
    sergey-b
    13.06.2021 20:56
    #23145682
    Истина где-то посередине
    
    $ java -Xss16k -version The Java thread stack size specified is too small. Specify at least 136k Error: Could not create the Java Virtual Machine.
    
    java у меня 11-я
    
    BugM
    13.06.2021 21:09
    #23145706
    Это вы максимум ограничили. При старте потока столько не выделяется.
    Реально выделяется что-то ближе к моим цифрам.
    
    Примерно так посмотреть можно java -XX:+UnlockDiagnosticVMOptions -XX:NativeMemoryTracking=summary -XX:+PrintNMTStatistics -version
    
    У меня вот так получилось
    - Thread (reserved=16454KB, committed=590KB) (thread #16) (stack: reserved=16384KB, committed=520KB) (malloc=53KB #98) (arena=17KB #30)
    
    sergey-b
    13.06.2021 21:14
    #23145716
    То ли я не правильно читаю, то ли под поток зарезервировано 16 мегабайт, из которых практически все под стек. Насколько я помню, ява за стеком резервирует память, при попытке записи в которую выбрасывается исключение. .Net так не делает, поэтому у него при переполнении стека процесс всегда крэшится. А ява держит за концом стека лишнюю память, благодаря которой она может продолжить работу после переполнения.
    
    BugM
    13.06.2021 21:20
    #23145734
    Зарезервированная память != использованная память.
    jdk научилась очень оптимально в этом месте память тратить.
    
    Вот тут почитать можно dzone.com/articles/how-much-memory-does-a-java-thread-take
    
    sergey-b
    13.06.2021 21:30
    #23145764
    Ну хотя бы committed уже использованная память? А там 520 Кб, как раз среднее между вашей оценкой и оценкой вашего собеседника.
    
    BugM
    13.06.2021 21:41
    #23145796
    Не совсем. Это реально использованая память в среднем на поток. Потоки что-то делают и потребляют память. Даже в таком пустом примере.
    
    Для сборки честного примера сколько требует один ничего не делающий поток надо сделать что-то вроде пула тысяч на 10 потоков которые не делают ничего. И вывести аналогичную статистику.
    Я подозреваю что она даже от ОС зависеть будет.
    
    Скоро соберу такой пример для иллюстрации… Действительно неочевидное место.
    
    BugM
    14.06.2021 01:59
    #23146166
    Как и обещал более честный пример:
    java -version openjdk version "11.0.10" 2021-01-19 OpenJDK Runtime Environment AdoptOpenJDK (build 11.0.10+9) OpenJDK 64-Bit Server VM AdoptOpenJDK (build 11.0.10+9, mixed mode)
    
    Код примера:
    
    static ThreadPoolExecutor tpe = (ThreadPoolExecutor) Executors.newFixedThreadPool(10000); static Object lock = new Object(); public static void main(String[] args) throws IOException { synchronized (lock) { for(int i=0; i<10000; ++i) { tpe.submit(() -> { synchronized (lock) { System.out.println("newer happend"); } }); } System.exit(0); } }
    
    Параметры VM
    -Xms1G -Xmx1G -XX:+UnlockDiagnosticVMOptions -XX:NativeMemoryTracking=summary -XX:+PrintNMTStatistics
    
    Результат
    - Thread (reserved=10304449KB, committed=663961KB) (thread #10018) (stack: reserved=10258432KB, committed=617944KB) (malloc=34278KB #60110) (arena=11739KB #20035)
    
    663961KB на 10_000 потоков или 66 килобайт на поток. На самом деле еще немного меньше, там на самом деле больше потоков. Но это уже не принципиально. Порядок примерно такой.
    
    Расходы с которыми можно смириться.
    
    Алексей «Наше Все» Шипилёв такие тесты не одобряет, но порядок оверхера на поток понять хватит.
    
    PS: Ради интереса на 15 и на 17 jdk прогнал тоже самое. Результат примерно такой же.
    
    SimSonic
    14.06.2021 06:13
    #23146292
    Так это в таком примере простом размер commited такой, потому что поток ничего кроме записи в консоль не делает. В реальной жизни большая вложенность стека, в том числе куча проксей, и в методах может быть куча аллоцированных на стеке данных.
    Я лично в своих проектах (джава 15, к слову) уменьшаю Xss до 512 кб, потому что уменьшать дальше страшновато. То, что commited != max это понятно и замечательно.
    
    BugM
    14.06.2021 14:04
    #23147162
    Так я и мерял именно пустые потоки. Когда вы начинаете что-то там делать вы эту память используете. Никаких проблем.
    Надо меньше? Пишите код более оптимально.
    
    Неправильный тезис был такой: Поток потребляет мегабайт или около того. Просто так. Сам по себе. И значит их стоит экономить.
    
    sergey-gornostaev
    14.06.2021 13:34
    #23147072
    Возьмем популярный веб сервер jetty. У него поток на каждого клиента. Сотни выбираются сразу. До тысячи добраться легко.
    Вы считаете что с разработчиками jetty что-то не в порядке, они не умеют считать ресурсы и написали код неоптимально?
    
    Даже в старых версиях Jetty на каждого клиента поток не выделялся, он брался из пула с верхним лимитом по умолчанию равным 200. Пул можно раздуть, конечно, но это всё равно не позволяло справиться с проблемой c10k. Начиная с версии 9.3 под капотом у них мультиплексирование неблокирующихся сокетов, а пулы потоков используются только для поддержки спецификации сервлетов. Причём они писали, что активно экспериментируют с реактивным подходом для разработки более удобного API и упрощения кода. Проще говоря, сами разработчики Jetty знают, как писать сопровождаемый и производительный код, но своим пользователям предоставляют возможность писать иначе.
    
    Он в мире не взлетает. Процент использования в больших проектах что-то около нуля.
    
    Возможно, такое впечатление у вас сложилось потому, что Spring Reactor приходится конкурировать с более зрелым Akka Streams в достаточно узкой нише высоконагруженных проектов. Или потому, что вы просто не знаете о всех случаях его успешного применения. Например Spring Reactor применяется в Сбере, у которого проекты несомненно большие.
    
    BugM
    14.06.2021 14:17
    #23147208
    Даже в старых версиях Jetty на каждого клиента поток не выделялся, он брался из пула с верхним лимитом по умолчанию равным 200.
    
    А где я говорил слово выделяется? Естественно там пул. Настраиваемый.
    
    Поток используется. Он именно используется для работы, не для поддержки чего-то там. В 9.х все тоже самое.
    support.sonatype.com/hc/en-us/articles/360000744687-Understanding-Eclipse-Jetty-9-4-8-Thread-Allocation
    webtide.com/thread-starvation-with-eat-what-you-kill-2
    
    в достаточно узкой нише высоконагруженных проектов
    
    Нагрузка это шардирование и балансировка. Ну и оптимальные алгоритмы с архитектурой сбоку. Все остальное не очень важно.
    
    Например Spring Reactor применяется в Сбере, у которого проекты несомненно большие.
    
    Так себе пример. У них нет ни одного удачного проекта, кроме собственно банка.
    Как раз то место где можно писать write only код, а потом следующие перепишут. Или проект просто умрет.
    
    rjhdby
    16.06.2021 00:53
    #23152840
    Например Spring Reactor применяется в Сбере
    Вот не самая лучшая отсылка, ей богу :)
    
    Реактор хорош, спору нет, но только когда не вылезает за границы ниши, в которой он хорош. На "границе сред", где есть ожидание ввода/вывода — да, шикарен. Пробросить с минимальной обработкой из одной трубы в другую — тоже да. Но строить полноценную логику — увольте. Если прям категорически важна легковесная асинхронность посредине — лучше уж в корутины развернуть, тем паче, что у коллег котлин.
    
    sergey-gornostaev
    16.06.2021 09:14
    #23153404
    С реактором я особо не работал, но построенный на аналогичных принципах Akka Streams очень удобен для полноценной логики и не минимальной обработки.
1. mayorovp
  15.06.2021 02:13
  #23149120
  Вот как раз подобные, э-э-э, типичные джейсоноперекладывалки замечательно укладываются в асинхронщину. И не пользоваться этим глупо.
  И да что в этом коде не так с чтением кода? Замечательно читается и замечательно редактируется. Особенно если вместо Flux взять простые сопрограммы, но это не обязательно.

envy12
14.06.2021 16:05
#23147554
Про prefetch можете ещё раз объяснить, пожалуйста?
1. EatingPeopleIsFun Автор
  14.06.2021 16:06
  #23147560
  Прелесть статьи в том, что ее можно перечитать :) задайте конкретные вопросы, что не понятно, попробуем разобраться

RustamKuramshin
14.06.2021 20:02
#23148330
Спасибо за статью. На работе используем стек Spring WebFlux, Reactor и Kotlin. Напили два микросервиса на них. В принципе норм.

Разгоняем REACTOR +6

Кому будет интересно?

Блокирующий и неблокирующий код

Разгоняемся сами

А это вообще легально?

Разрыв шаблона. Thread Pool & Reactor

Конфигурируем реактор!

Thread Pool

Распределение задач по рельсам

Комментарии (29)

EatingPeopleIsFun Автор

EatingPeopleIsFun Автор

EatingPeopleIsFun Автор

EatingPeopleIsFun Автор

EatingPeopleIsFun Автор