Project Loom: виртуальные потоки в Java уже близко / forpes.ru

Главная
Project Loom: виртуальные потоки в Java уже близко

Project Loom: виртуальные потоки в Java уже близко +19

22.05.2020 20:27

AlexeySoshin 49 5000 Источник

Несколько дней назад Ron Pressler разродился статьей State of Loom, которую не полайкал только самый ленивый джавист. Статья действительно хорошая, в ней много интересных метафор, которые я собираюсь бессовестно использовать теперь без ссылки на первоисточник.

Со своей стороны я неосторожно позволил высказать некоторый скептицизм, когда же с этим Project Loom можно будет наконец-то реально поработать. Спустя буквально час прилетела ответочка от самого Ron'а — «а ты попробуй!». Что ж, пришлось пробовать.

Что потребовалось для эксперимента:

JDK15 включающий в себя Project Loom
Terminal, поскольку IntelliJ и Gradle наотрез отказались работать с такой дичью

Для начала я решил посмотреть, как будет выглядеть классический пример с потоками из документации к Kotlin Coroutines. Пример написан на Kotlin, но переписать его на Java не составит труда:

public class Main {
    public static void main(String[] args) {
        var c = new AtomicLong();
        for (var i = 0; i < 1_000_000; i++) {
            new Thread(() -> {
                c.incrementAndGet();
            }).start();
        }

        System.out.println(c.get());
    }
}

Запускаем и убеждаемся, что пример все еще виснет, как и раньше:

javac Main.java && java Main

Теперь перепишем пример используя виртуальные потоки, которые нам предоставляет Project Loom:

for (var i = 0; i < 1_000_000; i++) {
    Thread.startVirtualThread(() -> {
        c.incrementAndGet();
    });
}

Результат не заставляет себя долго ждать:

Насколько долго?

Тут я намеренно не стал замерять, насколько быстро вернулся результат.
Во-первых, как не устает повторять Gil Tene, хорошие микробенчмарки — это сложно и долго.
Во-вторых, это было бы пока несправедливо к Project Loom, все еще находящемуся в бете. Порешим, что программа не зависла — уже хорошо.

Но само по себе это меня не слишком впечатлило. В конце-то концов, с coroutine'ами в Kotlin легко достигается тот же результат.

Рон в своей статье верно подмечает, что в Kotlin пришлось ввести функцию delay(), которая позволяет корутине «уснуть», поскольку Thread.sleep() отправляет «спать» не текущую корутину, а текущий scheduler thread, которых не много, обычно по количеству CPU.

А как с этим обстоят дела в Project Loom?

for (var i = 0; i < 1_000_000; i++) {
  Thread.startVirtualThread(() -> {
    c.incrementAndGet();
    try {
        Thread.sleep(1_000);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
  });
}

Результат:

где-то 400K

А вот это уже интересно! С Project Loom вызов Thread.sleep() умеет отличать, находится ли он в обычном потоке, или же в виртуальном, и срабатывает по разному.

Это уже само по себе весьма круто. Но давайте копнем еще чуть глубже:

var threads = new ArrayList<Thread>();
var cores = 10;
for (var i = 0; i < cores; i++) {
    var t = Thread.startVirtualThread(() -> {
        var bestUUID = "";
        for (var j = 0; j < 1_000_000; j++) {
            var currentUUID = UUID.randomUUID().toString();
            if (currentUUID.compareTo(bestUUID) > 0) {
                bestUUID = currentUUID;
            }
        }
        System.out.println("Best slow UUID is " + bestUUID);
    });
    threads.add(t);
}

for (var i = 0; i < cores; i++) {
    var t = Thread.startVirtualThread(() -> {
        var bestUUID = UUID.randomUUID().toString();
        System.out.println("Best fast UUID is " + bestUUID);
    });
    threads.add(t);
}

for (Thread t : threads) {
    t.join();
}

Тут мы запускаем 10 медленных задач и 10 быстрых задач. Быстрые задачи быстрей медленных в миллион раз, так что логично было бы предположить, что завершаться они раньше.

Но не тут то было:

Best slow UUID is fffffde4-8c70-4ce6-97af-6a1779c206e1
Best slow UUID is ffffe33b-f884-4206-8e00-75bd78f6d3bd
Best slow UUID is fffffeb8-e972-4d2e-a1f8-6ff8aa640b70
Best fast UUID is e13a226a-d335-4d4d-81f5-55ddde69e554
Best fast UUID is ec99ed73-23b8-4ab7-b2ff-7942442a13a9
Best fast UUID is c0cbc46d-4a50-433c-95e7-84876a338212
Best fast UUID is c7672507-351f-4968-8cd2-2f74c754485c
Best fast UUID is d5ae642c-51ce-4b47-95db-abb6965d21c2
Best fast UUID is f2f942e3-f475-42b9-8f38-93d89f978578
Best fast UUID is 469691ee-da9c-4886-b26e-dd009c8753b8
Best fast UUID is 0ceb9554-a7e1-4e37-b477-064c1362c76e
Best fast UUID is 1924119e-1b30-4be9-8093-d5302b0eec5f
Best fast UUID is 94fe1afc-60aa-43ce-a294-f70f3011a424
Best slow UUID is fffffc24-28c5-49ac-8e30-091f1f9b2caf
Best slow UUID is fffff303-8ec1-4767-8643-44051b8276ca
Best slow UUID is ffffefcb-614f-48e0-827d-5e7d4dea1467
Best slow UUID is fffffed1-4348-456c-bc1d-b83e37d953df
Best slow UUID is fffff6d6-6250-4dfd-8d8d-10425640cc5a
Best slow UUID is ffffef57-c3c3-46f5-8ac0-6fad83f9d4d6
Best slow UUID is fffff79f-63a6-4cfa-9381-ee8959a8323d

Интуиция работает лишь до тех пор, пока количество медленных задач меньше, чем количество ядер вашего CPU.

Причина проста — в данный момент Project Loom использует обычный ForkJoinPool. В итоге, не смотря на то, что в документации и по задумке указано, что виртуальные потоки «вытесняющие» (preemtive), в данный момент они ведут себя на «кооперативный» манер. Как и корутины в Kotlin'е, собственно.

Следует отметить, что в вышеупомянутой статье Рон упоминает, что размышляет и о forced preemtion поведении, как у обычных потоков. Но пока это не реализовано, потому что не до конца понятно, насколько такое поведение полезно, когда потоков могут быть десятки тысяч. Тем не менее, в Go 1.14 forced preemtion незаметно ввели.

Вызов функции, в отличие от Go, не приводит к context switch'у. Suspend, как в Kotlin, тоже не завезли. Но можно обойтись Thread.yield(), или вызовом любой Java IO функции: System.out.println(" "), к примеру.

Рассчет прост — большинство реальных программ используют blocking IO достаточно часто. И именно его использование Project Loom и стремится решить в первую очередь.

Немного выводов:

Вынужден признать, что не смотря на мой первоначальный скепсис, Project Loom меня положительно впечатлил. Для обычных Java пользователей, он обещает легковесную многопоточность без нужды в переходе на другой язык, использовании библиотеки или фреймворка. Что уже звучит неплохо.

Но основную революцию, как я ожидаю, это проект совершит среди разработчиков библиотек, которым до сих пор приходилось решать проблему concurrency снова, и снова, и снова. Теперь же, с распространением JDK15, это проблему можно будет переложить на JVM, как раньше перекладывали на JVM оптимизацию памяти (GC) и кода (JIT).

Ссылка на мою оригинальную статью, если вы предпочитаете читать на английском.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Видите ли вы применение Project Loom в своем проекте?

45,7%Да58
18,9%Нет24
35,4%У меня Kotlin45

Комментарии (49)

sshikov
23.05.2020 10:33
#21649258
+6
>У меня Котлин
А у меня Java 8. И так будет еще долго.
1. shishmakov
  26.05.2020 22:44
  #21663380
  Всё это очень похоже про разговоры о Java SE 6 в 2014, когда появилась сама Java SE 8. Вы всегда можете уйти туда где Java SE 11 в проде сейчас.
  1. sshikov
    27.05.2020 08:30
    #21664138
    Зачем мне туда? У меня вполне интересные задачи тут.
    
    Все дело в том, что оракл (выпустив Java 9) поменял свою политику выпуска релизов, и эта новая политика частых релизов многих не устраивает на самом деле. Новые релизы нужны тем, кто делает новые проекты, а тем кто эксплуатирует старые много лет — нужна стабильность и совместимость. А они ее сломали. Это был пожалуй единственный релиз, который сломал например maven и gradle. Хотя уж казалось бы, там-то что можно сломать? Даже Java 5 не вызывала таких проблем при миграции (я в своей практике мигрировал раз пять, а считая JavaEE — еще больше).
    
    shishmakov
    27.05.2020 14:45
    #21665740
    — Хотя уж казалось бы, там-то что можно сломать?
    Это Jigsaw, класс Unsafe и Reflection, чтобы не получали доступ к тому, что не было запроектировано.
    
    Проект Jigsaw ломает доступ к использованию непубличного API. Поэтому сравнение с Java SE 5 некоректно. Когда получилось проект влить в релиз — тогда и сделали. Так совпало, что всё это попало в Java SE 9, а могли и в 8 уже всё это увидеть при определённой развитии истории.
    
    Стабильность это LTS: Java SE 8, 11, 17. Все другие выпуски проходные и мне непонятно зачем крутить счётчик 2 раза в год. Зря отказались от версионирования как в Ubuntu.
    
    sshikov
    27.05.2020 18:24
    #21666752
    >— Хотя уж казалось бы, там-то что можно сломать?
    >Это Jigsaw, класс Unsafe и Reflection, чтобы не получали доступ к тому, что не было >запроектировано.
    Не уверен, что gradle и мавену это все нужно. Скорее уж сломали что-то в класслоадерах (и даже примерно понятно, что именно).
    
    >Проект Jigsaw ломает доступ к использованию непубличного API. Поэтому сравнение с Java SE 5 некоректно.
    Сравнение тут затем, что даже сложный переход на generics не стоил когда-то таких усилий (ну, это мои впечатления, если что). И судя по ним же, никогда столько народу не оставалось сидеть на старых версиях, как после выхода Java 9. Когда это получилось — уже не так важно. Важно что это решение сломало обратную совместимость, с которой до этого все было сильно получше.
    
    Ну то есть, я почему maven и gradle упомянул — потому что до этого никогда релизы не ломали такие базовые вещи, как системы сборки — идеологически достаточно простые, в общем-то. А тут сумели. А уж если говорить о проектах посложнее…
    
    Вот оно в 2017 вышло — а до сих пор скажем Hadoop не может завершить миграцию как следует. И какой вывод напрашивается? Что на пользователей хадупа при выпуске 9 наплевали. Что ораклу нужно было решить свои проблемы. Ну вот они наплевали и решили — теперь и имеем то что имеем. Какая там доля Java 8 на сегодня, не напомните?

imanushin
23.05.2020 11:44
#21649478
Видите ли вы применение Project Loom в своем проекте?
Голосование не совсем корректное, так как отсутствует мультивыбор.

В частности, для проекта с Kotlin и Oracle + JDBC имеет смысл протестировать loom. Oracle не планирует уже делать неблокирующий интерфейс, так что только loom и спасет.

Далее, если loom окажется быстрее корутин (а для этого есть все шансы, так как он, например, выделяет меньше памяти, плюс обрабатывает исключения нативно), то вообще имеет смысл уходить от условного ktor client на старый добрый Apache Client, который автоматом станет неблокирующим. Заодно можно получить потоковую десериализацию.
1. darkit
  23.05.2020 12:39
  #21649670
  А почему сейчас нельзя взять вам AsyncHttpClient или WebClient
  1. imanushin
    23.05.2020 14:22
    #21650048
    Они оба неблокирующие. Как и ktor.
    
    После loom у них у всех трех будет одна общая проблема: все создают ненужные объекты в куче, т.е. CompletableFuture, Mono, Flux, Flow и так далее. Плюс, ради проброса исключений, у них есть код, который "восстанавливает callstack", который тоже требует ресурсов. Плюс улетают JVM оптимизации вида "выделяем объект на стеке, так как он не возвращается наружу никогда" и море других похожих.
    
    Кстати, Spring Flux тоже будет не особо нужен, так как он выделяет море лишних объектов в куче ради асинхронности. Вот пример такой проблемы (она осталась, просто не видна), вот статья про неё на хабре.
    
    Servlet 4.0 (см. 2.3.3.3) тоже содержит неблокирующие опции, от которых надо будет избавляться, как от ненужных.
    
    Netty весь построен на колбеках, что будет не нужно.
    
    В общем, Loom полезный проект. Однако из-за него, для более эффективной работы, надо будет переписать много чего, чтобы избавиться от текущей модели явной асинхронности и начать использовать неявную. А значит и потребуются правки в коде приложений.
    
    sergey-gornostaev
    23.05.2020 21:56
    #21651354
    В Erlang изначально green threads, но тем не менее используются акторы. Думаю, что и в Java абстракции над многопоточностью и асинхронность смысла не потеряют, просто будут выжимать меньший процент производительности.
    
    darkit
    23.05.2020 22:56
    #21651532
    То что вы написали это все правда. Вопрос был в другом зачем уходить на
    
    то вообще имеет смысл уходить от условного ktor client на старый добрый Apache Client
    когда описанные асинхронные клиенты удобней в плане работы с АПИ.
    
    Я часто видел стектрейсы гораздо длинней на обыкновенной джаве :)))
    
    Вот пример такой проблемы (она осталась, просто не видна)
1. pin2t
  23.05.2020 14:55
  #21650172
  Если вы про HTTP Client, Apache Client тоже ненужен, в Java 11+ есть HTTP client в стандартной библиотеке

commenter
23.05.2020 18:44
#21650870
А чем вся эта кухня лучше обычного:
```
for (int i=0;i<1000_000;i++)
    tasks.add(()->/* do something */);
for (int i=0;i<tasks.size();i++)
    task.get(i).run();
```
Ради чего расширяется набор базовых библиотек???
1. pin2t
  23.05.2020 19:07
  #21650926
  +2
  Видимо тем что если внутри .run() будет сетевой вызов или чтение файла — на время ожидания ввода-вывода автоматом переключится на другой task
  1. commenter
    23.05.2020 21:55
    #21651350
    -1
    С чего вы это взяли?
    
    Не знаю, что конкретно сочинили в Java15, но «переключиться на другой таск» означает ровно всё то же самое, что и переключиться на другой поток, а значит нет главного — никаких отличий от старого.
    
    Хотя опять же есть асинхронное IO. Если мне нужно «переключаться на другой таск», то я сам укажу программе где и как я хочу переключиться, просто использовав что-то вроде пакета nio. Соответственно — зачем мне нововведение, где что-то действует неконтролируемым образом?
    
    По сути вопрос о внутреннем устройстве нововведения. Если оно известно — можно что-то обсуждать. Если нет — просто нечем обосновывать ценность нововведения. Мне неизвестно, думал автор статьи пояснит, но он отмалчивается. Значит придётся ждать более вменяемых описаний.
    
    mayorovp
    23.05.2020 22:05
    #21651386
    +1
    Внутреннее устройство нововведения уже было на Хабре ранее. Раздача халявы: нетормозящие треды в Java. Project Loom
    
    commenter
    24.05.2020 02:15
    #21651996
    Спасибо, почитал. Не смотря на откровенно быдляцкий язык автора той статьи, понять его вполне можно. Суть в расшивании проблемы stack overflow при кооперативном переключении (включая неявное) на другие псевдо-потоки. Хотя неявное переключение, как пишет автор, реализовали очень ограничено (но от его стиля изложения веет полнейшим трешем, поэтому непонятно, кто здесь виноват — пошлость автора или всё же ограничения со стороны разработчиков JVM).
    
    Но тем не менее всё так же непонятно, с чего автор обсуждаемой здесь статьи (уже не по вашей ссылке) считает, что в подобной реализации возможно какое-то другое вытеснение псевдо-потоков кроме кооперативного. Судя по данным по вашей ссылке никакого другого подхода там быть не может (кроме кооперации и неявного переключения в некоторых избранных местах, в виде нативных вызовов, которые и реализуют переключение). Может автору тоже стоит познакомиться с материалом по ссылке.
    
    mayorovp
    24.05.2020 11:53
    #21652770
    А в чём проблема кооперативного вытеснения?
    
    commenter
    24.05.2020 12:25
    #21652878
    Теряется смысл потока.
    
    Потоки загружают ядра. Если убрать переключение потоков — ядра будут недогружены. Кооперация гарантирует, что переключение во многих случаях работать перестанет из-за множества проблем на стороне писателей в кооперативном стиле.
    
    Но и вам вопрос — а в чём преимущества кооперации потоков?
    
    mayorovp
    24.05.2020 15:51
    #21653564
    С чего бы ядра будут недогружены-то?
    
    shuron
    24.05.2020 16:56
    #21653766
    Два уровня же. Виртуальные треды проецируются на процессорные. Вот с загруской процессорных какраз пока особо ничего не меняется, кроме того, что им потенциально будет больше поделать а не меньше.
    
    commenter
    24.05.2020 17:32
    #21653864
    -1
    Ну то есть вы легко сможет привести пример полезного использования озвученной технологии?
    
    iNikNik
    24.05.2020 19:11
    #21654112
    Например Erlang с его green threads.
    
    shuron
    24.05.2020 20:14
    #21654312
    Если вы про VirtualThread то, как-бы очевидно же (покрайней мере мне) что блокирующий код легче читать/писать… не нужно лишних нагромождений а иммено это опять будет возможно не теряя все плюшек многопоточности.
    
    commenter
    24.05.2020 21:44
    #21654570
    -1
    Понятно. Получается, что все отвечающие примера привести не могут.
    
    Хотя да, общие слова — это наше всё. Так что я обязательно поставлю галку «зачтено» в виртуальном журнале против ваших ников.
    
    Ну и так, напоследок:
    
    for (int i=0;i<1000_000;i++) tasks.add(()->/* do something */); for (int i=0;i<tasks.size();i++) task.get(i).run();
    
    И два:
    
    for (int i=0;i<1000_000;i++) { /* do something */ }
    
    Что по вашему проще?
    
    shuron
    24.05.2020 21:58
    #21654616
    Смотрите если в tasks у вас обычные треды вы там с блокирующими операциями просядите. Это понятно?
    С виртуальными тредами не просядите, потому что когда до операции ввода/вывода дойтете то виртуальный тред хоть и будет ждать, но реальный не будет простаивать.
    Тем самым вы упрощаете код который у вас:
    
    /* do something */
    
    там вы можете в лоб теперь блокирующе читать файлы или сокет… 100 000 раз. и все это без колбэков в коде. У меня нет под рукой сейчас примера с колбэком и без. Влом выдумывать.
    
    а то что вы показали останется тем же.
    
    commenter
    25.05.2020 12:01
    #21656170
    вы там с блокирующими операциями просядите
    
    Дело в том, что альтернатива, во первых (а это ошибки), неявно, а во вторых, для очень ограниченного количества действий, расшивает указанную вами проблему. Из этого следует, что каждый раз программист будет думать, долго и без гарантий правильности. В итоге будут все те же ошибки, что и с обычными потоками, плюс дополнительно проблемы из-за специфики псевдо-потоков. В сумме = хуже.
    
    Ну и помимо «общечеловеческих ценностей» есть ещё и неблокирующее IO API. И что мешает просто взять и его использовать? Не наступая на грабли с новыми псевдо-потоками. Ведь вы именно на асинхронное IO упираете, доказывая ценность псевдо-потоков. И вот оно, асинхронное IO, и так есть, и давно используется, ну и без приставки псевдо.
    
    shuron
    25.05.2020 12:20
    #21656274
    неблокирующее IO API. И что мешает просто взять и его использовать?
    Используйте. Вам никто не мешает.
    Но неблокирующее какраз больше кода, об этом же и пишу вам. Сложнее ментальная модель, сложнее в дебаге.
    С новыми тредами вам это не нужно будет во многих случаях. Тоесь вы просто можете забитъ на ассинхронне апи, БЕЗ особого усложнения понятия тред. Вы почему-то пытаетесь доказать что треды будут сложнее. На мой же взгляд разница помойму очень проста, еще один уровень абстракции как в Го с сохранением АПИ.
    Может у вас свой специфический контектс и там все так как вы говорите — тогда это частный случай скорее.
    
    ИМХО мне кажется это очень правильное направление и упросит в будушем многое. 16 ядрами сейчас никого не удивишь к примеру. С лекговесными треадами и простым блокирующим кодом их будет проще запользовать — это правильное направление ИМХО.
    
    iNikNik
    25.05.2020 15:19
    #21657156
    это правильное направление
    
    Правильное направление — это наконец-то понять, что асинхронный код существует уже много лет и есть нетривиальное количество примеров и подходов, которое позволяет примерно оценить наиболее эффективное направление.
    
    А то, что сейчас джависты идут по пути, который, скажем, JavaScript комьюнити уже прошло N-лет назад (callback hell -> promises hell -> control flow streams\...), наступая по пути на все те же грабли просто потому что «мы привыкли писать синхронный блокирующий код но это нормально не работает на 32ядерном тред-риппере, давайте закостылим!». Просто смешно.
    
    Если бы это была какая-то революция — еще можно было понять. Сейчас асинхронный конкурентный код — это стандарт для высоконагруженного бэкенда.
    
    Я не против появления грин-тредов, но при их проектировании надо учитывать реальный контекст применения, а не пытаться спасти динозавров.
    
    shuron
    25.05.2020 15:49
    #21657254
    +1
    Я не против появления грин-тредов, но при их проектировании надо учитывать реальный контекст применения, а не пытаться спасти динозавров.
    дайте хоть пример того что не учтено?
    П.С. Смотрите на Golang. Я лично не понимаю пока вашей аргументации. Мне кажется вы противоречите себе.
    
    pin2t
    25.05.2020 20:25
    #21658424
    -1
    Костыли это как раз JavaScript в бэкенде. callback hell и т.д. Костыли это потому что технологию, которая работает в браузере, где событийно-ориентированность это нормально и естественно, притащили в бэкенд. И если 20 лет назад это дейтсвительно работало лучше, потому что процессор был один. То в современных реалиях это жутко неффективно и тотально проигрывает нормальным тредам на современном 32-х ядерном тредрипере. Потому что треды на таком тредрипере выполняются действительно параллельно.
    
    Но фронтендеры, привыкшие обрабатывать нажатие мышки по кнопочке, не понимают как написать многопоточную программу, вот и лепят свою лапшу из коллбэков в свою node.js.
    
    mayorovp
    25.05.2020 21:14
    #21658602
    Скажите, а что вам, настоящим бэкендерам, мешает обрабатывать асинхронные задачи многопоточно?
    
    Kestrel вот почти без усилий держит 10 000 одновременных HTTP соединений, мы в феврале это выяснили. А многопоточный сервер в тех же условиях умирает.
    
    pin2t
    25.05.2020 21:58
    #21658760
    Скажите, а что вам, настоящим бэкендерам, мешает обрабатывать асинхронные задачи многопоточно?
    
    Ну обычно в защиту лапши из коллбэков приводят аргумент мол ненадо синхронизироваться, а если их обрабатывать многопоточно — синхронизироваться все-таки надо, ну и теряется смысл такой системы
    
    mayorovp
    25.05.2020 22:07
    #21658790
    Это вы какие-то странные аргументы читали. Смысл асинхронности — в уменьшении требований к ресурсам: не нужно выделять кучу памяти в виде стека для потока, в том числе в режиме ядра.
    
    iNikNik
    26.05.2020 14:08
    #21661118
    +1
    Но фронтендеры, привыкшие обрабатывать нажатие мышки по кнопочке, не понимают как написать многопоточную программу, вот и лепят свою лапшу из коллбэков в свою node.js.
    
    Звучит как какая-то обида на фронтенд…
    
    callback hell и т.д.
    
    Что значит «и т.д.»? Callback hell — это были первые попытки структурировать асинхронный код. С тех пор мир уже ушел далеко вперед и есть гораздо более эффективные и элегантные решения о чем я и писал в своем комментарии.
    
    То в современных реалиях это жутко неффективно и тотально проигрывает нормальным тредам на современном 32-х ядерном тредрипере. Потому что треды на таком тредрипере выполняются действительно параллельно.
    
    100%. Поэтому я и говорю, что для высоконагруженной программы нужно писать асинхронный + конкурентный код. Это позволит добиться наилучших результатов при использовании ограниченных вычислительных ресурсов
    
    GreyN
    26.05.2020 00:00
    #21659102
    Посмотрите пожалуйста статью What Color is Your Function?
    
    Project Loom как раз пытается хотя бы частично решить именно те проблемы, о которых Вы пишете. Эти проблемы есть во всех языках, поддерживающих синхронные и асинхронные вызовы. И пока совсем идеального решения никто не нашел.
    
    Java — это не про революцию. И это очень хорошо.
    Тут у некоторых людей проблемы с переездом с 8-ки из-за добавления микросекунд в Instant.now(), а Вы про какую-то революцию говорите.
    
    Ну и я совсем не понял, почему Вы ставите знак равенства между «асинхронность» и «высокая нагрузка», не поясняя, что имеется в виду под «нагрузка».
    
    iNikNik
    26.05.2020 14:03
    #21661078
    Ну и я совсем не понял, почему Вы ставите знак равенства между «асинхронность» и «высокая нагрузка», не поясняя, что имеется в виду под «нагрузка».
    
    Не совсем так. Я пытался сказать, что асинхронный конкурентный код — это самый эффективный способ использования вычислительных ресурсов, а значит — позволяет наиболее эффективно (с точки зрения потребления ресурсов) обрабатывать высокие нагрузки. Под нагрузками я имею ввиду то, что подразумевает термин highload.
    
    Асинхронный == треды не простаивают впустую.
    Конкурентный == все ядра CPU используются по максимуму.
    
    а Вы про какую-то революцию говорите
    
    Я про эволюцию. Чтобы подходы, которые имели место быть 10-15-20 лет назад заменялись подходами, которые актуальны сейчас.
    
    Посмотрите пожалуйста статью What Color is Your Function?
    
    Почитал, но что-то полезное оттуда вынести сложно. Как я выше написал — люди уже пережили callback-hell и прочие грабли с промисами. Уже есть адекватные механизмы построения control-flow Вашей асинхронной программы. Статья 2015 года, поэтому неудивительно, что автор не упоминает практически ни одного из них. Думаю, что в то время они были не особо распространены. Сейчас фактически все перечисленное там — не актуально.
    
    Project Loom как раз пытается хотя бы частично решить именно те проблемы, о которых Вы пишете
    
    Еще раз — я двумя руками за грин треды и прочие решения этих проблем. Но очень хотелось бы, чтобы это не было в стиле — «я обновил версию JVM и о чудо мой блокирующий код стал не блокирующим». Потому что это не сработает. По крайней мере в Java-мире.
    
    pin2t
    27.05.2020 08:24
    #21664130
    Но очень хотелось бы, чтобы это не было в стиле — «я обновил версию JVM и о чудо мой блокирующий код стал не блокирующим»
    
    Project Loom этого и не предлагает. Код остается таким же каким и был и по-прежнему блокируется, просто снижаются затраты ресурсов на поддержку и переключение тредов, соответственно их можно запустить больше и не волноваться о том, что запуск нового треда как-то затратен по ресурсам. Поэтому, например, пропадает смысл долгоживущих тредов, обрабатывающих очередь каких-то задач, можно запускать сразу все задачи в своих отдельных тредах. Это уже даже некое упрощение в сравнении с существующими подходами.
    
    AlexeySoshin Автор
    24.05.2020 12:12
    #21652826
    Знаком не только с вышеприведенной статьей, но так же с оригинальным выступлением:
    https://www.youtube.com/watch?v=J31o0ZMQEnI
    Как можно видеть, графики и объяснение как работает развертывание стека были взяты как раз оттуда.
    
    У том, что с Project Loom возможен и forced preemtion Ron Pressler писал мне тут:
    https://twitter.com/pressron/status/1262350580820869120
    
    И так же вскользь упоминает об этом в State of Loom:
    
    For this reason, none of the schedulers in the JDK currently employs time-slice-based preemption of virtual threads, but that is not to say it won’t in the future — see Forced Preemption.
    
    GreyN
    25.05.2020 00:01
    #21654898
    +1
    Многоуважаемый commenter, Ваша показная интеллигентность, по моему скромному мнению, не достаточно хорошо прикрывает неприкрытое хамство, но все же, предложу Вам обратить внимание на год публикации статьи по ссылке, а затем проследить за изменениями, которые произошли в Project Loom за все прошедшее время. Включая статью Ron Pressler, с которой начал автор текущей статьи.
    
    pin2t
    24.05.2020 02:16
    #21651998
    Асинхронной IO — это уже лапша с коллбэками, почему это не эффективно читайте выше комментарий habr.com/ru/post/503412/#comment_21650048. Я бы ещё добавил что асинхронной IO это абсолютно не читаемый и не поддерживаемый код.
    
    commenter
    24.05.2020 10:59
    #21652586
    -1
    В упомянутом API нет необходимости в коллбэках. Там достаточно уметь опрашивать каналы в цикле.
    
    В целом стремление впихнуть в абстракцию потока миллионы экземпляров точно так же чревато адской неэффективностью. Даже если памяти на псевдо-поток будет тратиться поменьше, дальнейшая обработка никак из штанов выпрыгнуть не сможет, ну и вся затея будет иметь смысл в очень и очень ограниченных нишах. Могу себе представить разве что какой-то самый примитивный роутер, распихивающий потенциально очень большие флуктуации на входе по вот таким недо-потокам, которые в итоге будут служить лишь цели усложнения архитектурного шаблона «очередь» (и памяти потреблять, разумеется, больше, чем оптимизированная очередь в памяти).
    
    Хотя возможно вы можете представить какое-то более разумное применение для сабжа?
    
    AlexeySoshin Автор
    24.05.2020 12:17
    #21652848
    Опрашивать каналы в цикле — тоже не самая очевидная вещь, когда всего лишь хотелось бы прочесть файл.
1. AlexeySoshin Автор
  23.05.2020 23:07
  #21651560
  +1
  Начать стоит с того, что вышеприведенный код запустится в одном потоке.

dmitryb-dev
24.05.2020 00:06
#21651728
Смотрю я на новые Java и вот не понимаю. Зачем из Java делать плохой котлин, если есть уже нормальный котлин? Фичи то классные и нужные, вот только как-то реализация их вызывает у меня отторжение, по крайней мере после kotlin/scala. Впрочем может я один такой?

Еще вот интересно, я не силен в системном программировании, но вот эти все модные корутины похожи на реализацию кооперативной многопоточности. А может есть вариант поставить систему (если такая есть конечно), которая изначально поддерживает кооперативную многозадачность и тогда получится, что можно будет любую блокирующую программу сделать неблокирующей, просто запустив ее на такой системе. Это конечно не спасет от циклов и длинных функций, в которых просто негде переключиться. Да и вообще куча «но» и это в принципе мысли вслух )

Еще интересно про Go, в статье написано:
Тем не менее, в Go 1.14 forced preemtion незаметно ввели.
А какой в этом смысл? Ведь это по факту копирует работу планировщика системы — не перечеркивает ли это все плюсы корутин?
1. AlexeySoshin Автор
  24.05.2020 00:52
  #21651872
  Ведь это по факту копирует работу планировщика системы — не перечеркивает ли это все плюсы корутин?
  Не перечеркивает. Из достоинств корутин стоит отметить динамический размер стека и более быстрый context switch. Так что иметь forced preemtion — полезная вещь, вот только Go в этом плане всегда ударяется в крайности. Либо preemtion для всех, либо ни для кого.
1. shuron
  24.05.2020 17:01
  #21653788
  -1
  вот эти все модные корутины похожи на реализацию кооперативной многопоточности.
  неа
  
  Virtual threads are preemptive, not cooperative — they do not have an explicit await operation at scheduling (task-switching) points

pin2t
24.05.2020 03:19
#21652058
Все-таки Java не была бы Java без излишнего ненужного переусложнения. Можно было и не добавлять новых сущностей virtual thread, просто сделали бы переключалку в виртаульной машине, с точки зрения разработчика поменяется только то что, что надо будет теперь везде в коде поменять thread на virtual thread.
1. AlexeySoshin Автор
  24.05.2020 12:18
  #21652852
  Хорошо, что хотя бы от Fiber терминологии избавились. А был же еще Strand.
1. shuron
  24.05.2020 17:04
  #21653796
  Ну они не могут просто так поменять конктракт. И правильно.
  На самом деле очень элегантно врезали новую фичу на мой вкус. Вы и сами пишите:
  
  с точки зрения разработчика поменяется только то что, что надо будет теперь везде в коде поменять thread на virtual thread.
  только можно и не менять или если то достаточно мало и без риска

Project Loom: виртуальные потоки в Java уже близко +19

Немного выводов:

Видите ли вы применение Project Loom в своем проекте?

Комментарии (49)

AlexeySoshin Автор

AlexeySoshin Автор

AlexeySoshin Автор

AlexeySoshin Автор

AlexeySoshin Автор