Главная
Какие изменения нужны языку Rust, чтобы писать асинхронный код стало проще

Какие изменения нужны языку Rust, чтобы писать асинхронный код стало проще +39

26.06.2021 12:00

S_ILya 45 8600 Источник

Асинхронное программирование — мощный инструмент. Но экосистема Rust продолжает активно развиваться, и пока язык далёк от идеала. В частности, по этой причине многие считают, что асинхронное программирование в Rust — это боль. Однако некоторые не только критикуют, но и предлагают. Среди таких людей автор данной статьи.

Здесь я расскажу о некоторых ранее предложенных идеях и свяжу их с новыми предложениями. Я проведу некий мысленный эксперимент и постараюсь ответить на вопрос «Что мы могли бы сделать с асинхронным программированием в Rust, если бы нам дали полный карт-бланш?».

Непродуманное внесение изменений в Rust может разрушить его. Поэтому всё нужно делать аккуратно, учитывая плюсы и минусы. Допускаю, что некоторые предложения могут вызвать негативную реакцию. Я отношусь к этому с пониманием и прошу читателя подойти к изучению этого материала максимально непредвзято.

Потоки vs Асинхронность

Писать асинхронный код зачастую сложнее, чем просто использовать потоки. Но с потоками мы не можем получить выигрыш в производительности, так как они слишком прожорливые. В процессе переключения между разными потоками и обмена данными между ними возникает много накладных расходов. Даже поток, который сидит и ничего не делает, использует ценные системные ресурсы. Чаще всего, асинхронный код работает гораздо быстрее. Но не всегда:

Например, этот echo server написан с использованием потоков. Он работает быстрее своей асинхронной версии — для случая, когда количество одновременных подключений не превышает 100.

На мой взгляд, лучший аргумент в пользу асинхронности таков:

она позволяет эффективно моделировать сложный процесс управления потоком исполнения.

Например, приостановку или отмену операции на лету будет сложно реализовать, не сделав эту операцию асинхронной. Или в случае, когда несколько потоков (одно соединение на один поток) конкурируют за ограниченный ресурс, приходится использовать примитивы синхронизации. Применяя концепцию асинхронности, мы можем добиться более высокой производительности, работая с несколькими соединениями в одном потоке.

Главная проблема с асинхронностью в Rust

Поначалу кому-то может показаться, что писать асинхронный код на Rust легко. Но его мнение изменится после первых трудностей, которые связаны с подводными камнями, не описанными в документации. Энтузиасты пытаются сами вести учёт и предлагать решения. Копать нужно сразу в нескольких местах, но на мой взгляд, самая большая проблема с асинхронностью в Rust связана с нарушением принципа наименьшего удивления.

Если назначение элемента или сочетания неясно, то его поведение должно быть наиболее ожидаемым. Код должен вести себя так, как ожидает программист.

В этой статье я буду много раз приводить пример с неким Аланом, который начал изучать Rust и сталкивается с первыми сложностями.

Итак, Алан прочитал книгу по Rust и доки Tokio. Он хочет написать свой чат-сервер. Алан выбирает простой линейный протокол и для шифрования строк использует префиксный код. Его функция парсинга строк выглядит так:

async fn parse_line(socket: &TcpStream) -> Result<String, Error> {
    let len = socket.read_u32().await?;
    let mut line = vec![0; len];
    socket.read_exact(&mut line).await?;
    let line = str::from_utf8(line)?;
    Ok(line)
}

Этот код очень похож на обычный, не асинхронный, код Rust, за исключением ключевого слова async и вызова .await. Хотя Алан никогда раньше не писал на Rust, он уверен, что знает, как работает эта функция. Как мы увидим позже, он ошибается. При локальном тестировании его чат-сервер работает без ошибок, поэтому Алан отправляет ссылку Барбаре. К сожалению, после небольшой переписки в чате сервер вылетает с ошибкой «invalid UTF-8». Теперь Алан не понимает, в чём дело: он проверяет код и не находит ошибок.

Так в чем проблема? Оказывается, под капотом, в стеке вызовов, используется макрос select!

Макрос futures::select запускает несколько футур (асинхронных вычислений) одновременно и передаёт управление пользователю, как только любая из футур завершится.

loop {
    select! {
        line_in = parse_line(&socket) => {
            if let Some(line_in) = line_in {
                broadcast_line(line_in);
            } else {
                // соединение закрыто, выходим из цикла
                break;
            }
        }
        line_out = channel.recv() => {
            write_line(&socket, line_out).await;
        }
    }
}

Предположим, что сообщение пришло в чат (через channel) именно в то время, когда parse_line всё ещё занят обработкой данных. Но select! прерывает операцию parse_line, не дав ей завершить парсинг. На следующей итерации цикла parse_line вызывается снова и начинает парсить с середины фрейма, что приводит к чтению тарабарщины.

В этом и заключается проблема: любая асинхронная функция Rust может перестать работать в любое время, так как её могут просто прервать. И это ситуация не является чем-то из ряда вон выходящим. Каким местом должен думать начинающий Rust-разработчик, чтобы понять причину такого поведения?

Да никаким. Нужно просто изменить это поведение — внести изменения в сам язык.

Изменение #1: Используем футуры с гарантированным завершением

Если поведение языка не соответствует ожиданиям и интуитивным представлениям, нужно подсказать ученику правильное направление, а не молчать. А по-хорошему, необходимо свести к минимуму вот такие неприятные сюрпризы в процессе обучения, особенно на раннем этапе.

Давайте начнём с исправления проблемы неожиданной отмены (или прерывания) асинхронных операций. Сделаем так, чтобы они выполнялись полностью (впервые эта идея была предложена здесь). Используя футуры с гарантированным завершением, мы добавляем в асинхронный Rust немного блокировок, но оставляем ключевые слова async и await. Создание порождённых задач (с помощью spawn) добавляет параллелизма, а асинхронные каналы (тип Channel) обеспечивают взаимодействие между потоками и обмен задачами. Поэтому передадим в select! каналы или «канальные типы» (например, JoinHandle).

Вот как изменится код из первых двух примеров:

async fn handle_connection(socket: TcpStream, channel: Channel) {
    let reader = Arc::new(socket);
    let writer = reader.clone();
    
    let read_task = task::spawn(async move {
        while let Some(line_in) in parse_line(&reader).await {
            broadcast_line(line_in);
        }
    });
    
    loop {
        // 
        select! {
            res = read_task.join() => {
                // соединение закрыто, выходим из цикла
                break;
            }
            line_out = channel.recv() => {
                write_line(&writer, line_out).await;
            }
        }
    }
}

Теперь все асинхронные операции должны выполняться полностью, select! принимает только канальные типы, вызов parse_line () перемещается внутрь порождённой задачи. Эти небольшие изменения в коде могли бы предотвратить проблему, с которой столкнулся Алан. Если Алан попытается вызвать parse_line () внутри select!, он получит ошибку компилятора с рекомендацией создать задачу, чтобы внутри неё вызывать эту функцию.

При использовании канальных типов внутри select! можно не переживать, что какие-то ветки не выполнятся. Каналы могут хранить значения атомарно. От того, что какие-то ветки не проработают, данные не потеряются.

Отмена асинхронной операции

Что произойдет, если при записи возникнет ошибка? В приведённом выше коде read_task продолжит работать. Но вместо этого Алан хочет, чтобы ошибка приводила к корректному закрытию соединения и всех задач. К сожалению, здесь мы уже начинаем сталкиваться с проблемами проектирования языка.

Если бы мы могли прервать любую асинхронную операцию в любой момент, всё бы решалось принудительным завершением футуры. Но теперь-то мы ввели футуры с гарантированным завершением! Возвращаться назад мы не будем, придётся внести в Rust новые изменения.

Возможность отменить операцию на лету — одна из главных причин использования асинхронного подхода. Попробуем использовать метод cancel ():

async fn handle_connection(socket: TcpStream, channel: Channel) {
    let reader = Arc::new(socket);
    let writer = reader.clone();
    
    let read_task = task::spawn(async move {
        while let Some(line_in) in parse_line(&reader).await? {
            broadcast_line(line_in)?;
        }
        
        Ok(())
    });
    
    loop {
        // 
        select! {
            _ = read_task.join() => {
                // соединение закрыто либо будет прервано из-за ошибки,
                // выходим из цикла
                break;
            }
            line_out = channel.recv() => {
                if write_line(&writer, line_out).await.is_err() {
                    read_task.cancel();
                    read_task.join();
                }
            }
        }
    }
}

Но что тут может сделать один cancel ()? Он не может немедленно прервать задачу, потому что мы используем футуры с гарантированным завершением. А мы хотим, чтобы отменённая задача прекратила работу и завершилась как можно скорее. К сожалению, вместо этого она просто вернёт ошибку «interrupted». Дальнейшие попытки использования ресурсов в этой задаче также приведут к ошибкам.

В итоге задача зависает на неопределённое время, продолжая выдавать сообщения об ошибках. Правда, в какой-то момент она всё-таки завершается.

Обнаружив такое странное поведение, Алан мог бы попытаться выяснить, что именно происходит, пока задача висит. Для этого можно добавить в код оператор println! или использовать другие способы отладки.

Явные и неявные вызовы .await

Без ведома Алана, его чат-сервер избегает большинства системных вызовов с помощью io_uring (это интерфейс взаимодействия с ядром Linux, позволяющий асинхронно отправлять и получать данные). Асинхронный Rust может прозрачно использовать io_uring API благодаря футурам с гарантированным завершением. Когда Алан сбрасывает значение TcpStream в конце handle_connection (), сокет должен асинхронно закрыться. Реализация AsyncDrop для TcpStream выглядит так:

impl AsyncDrop for TcpStream {
    async fn drop(&mut self) {
        self.uring.close(self.fd).await; // тут await вызывается НЕЯВНО!
    }
}

И как быть, когда .await вызывается неявно? Этот вопрос остаётся открытым. Сегодня для асинхронного ожидания завершения футуры требуется вызов .await. В этом случае трейт AsyncDrop добавляет ещё один подводный камень, когда управление выходит за пределы области видимости асинхронного контекста. Такое поведение нарушает принцип наименьшего удивления. Зачем нужны неявные вызовы .await, если наряду с ними используются явные?

Напрашивается решение проблемы в лоб:

все вызовы .await сделать явными.


my_tcp_stream.read(&mut buf).await?;
async_drop(my_tcp_stream).await;

А если, например, пользователь забудет сделать вызов async_drop(my_tcp_stream).await — что произойдет? Заметьте, что в приведённом выше фрагменте кода есть ошибка: оператор ? пропустит вызов async_drop, если чтение выполнится некорректно. Компилятор Rust может выдать предупреждение, указывающее на проблему, но как решить её?

Изменение #2: Отказываемся от .await

А что, если вместо требования явно вызывать async_drop (...).await, мы вообще удалим ключевое слово await? Тогда его не придётся писать после вызова каждой асинхронной функции (например, socket.read_u32 ().await). Однако, тогда при вызове асинхронных функций (с ключевым словом async) все вызовы .await становятся неявными.

Такой ход мыслей может показаться непоследовательным. И это так. Но все наши предложения и гипотезы нужно проверять. Неявный .await имеет ограниченное применение и зависит от контекста, поскольку встречается только в асинхронных операциях. Алану достаточно взглянуть на определение функции (на ключевое слово async), чтобы понять, что он находится в асинхронном контексте. Более того: легче станет не только Алану, но и анализаторам кода.

Отказ от явных вызовов .await имеет ещё одно преимущество: код становится больше похож на Rust без асинхронности. И тогда единственным заметным отличием становится необходимость аннотировать определённые функции ключевым словом async. В этом случае и проблема «ленивых футур» (которые запускаются только по необходимости) тоже отпадает сама собой, поэтому Алан не сможет «случайно» написать такой код и удивиться, почему «two» печатается первым.

async fn my_fn_one() {
    println!("one");
}

async fn my_fn_two() {
    println!("two");
}

async fn mixup() {
    let one = my_fn_one();
    let two = my_fn_two();
    
    join!(two, one);
}

Один из RFC-запросов в своё время действительно вызвал некую дискуссию по теме неявных вызовов .await. В то время наиболее убедительным аргументом против было то, что неявные вызовы .await увеличивают количество непредвиденных ситуаций, в которых асинхронная операция может быть прервана. Но в случае с футурами с гарантированным завершением этот аргумент теряет силу.

Как бы то ни было, отказ от явных вызовов .await — это очень серьёзное изменение, и к нему нужно подходить осторожно. Соответствующие исследования должны выявить, насколько плюсы перевешивают минусы.

Изменение #3: Отказываемся от Arc и используем scoped tasks

Теперь Алан может разработать свой чат-сервер с помощью асинхронного Rust, не заглядывая под капот и не сталкиваясь с неожиданным поведением. Компилятор рекомендует ему использовать канальные типы и добавить async к своим функциям, и эти рекомендации действительно работают. Он показывает свой код Барбаре и спрашивает, нужно ли использовать Arc для сокета (let reader = Arc::new(socket);).

Барбара вместо этого предлагает ему посмотреть в сторону scoped tasks. Это асинхронный эквивалент scoped threads. Задачи такого типа способны заимствовать данные, принадлежащие своему «родителю».

async fn handle_connection(socket: TcpStream, channel: Channel) {
    task::scope(async |scope| {
        let read_task = scope.spawn(async || {
            while let Some(line_in) in parse_line(&socket)? {
                broadcast_line(line_in)?;
            }

            Ok(())
        });
        
        loop {
            // 
            select! {
                _ = read_task.join() => {
                 // соединение закрыто либо будет прервано из-за ошибки,
                // выходим из цикла
                    break;
                }
                line_out = channel.recv() => {
                    if write_line(&writer, line_out).is_err() {
                        break;
                    }
                }
            }
        }
    });
}

Такое решение должно гарантировать выполнение асинхронных операций полностью. Но у него есть недостаток: для использования scoped tasks придётся сделать метод Future::poll небезопасным, поскольку теперь мы не сможем опрашивать футуру до её завершения. Разработчикам языка придётся добавить в язык небезопасную реализацию типажа Future. Придётся реализовать такие трейты, как AsyncRead и AsyncIterator. Но я считаю, что это достижимая цель.

Гарантия завершения асинхронных операций также позволит передавать указатели из scoped task в ядро Linux ??при использовании io_uring или при интеграции с футурами C++.

Изменение #4: Отказываемся от FuturesUnordered

Сегодня в асинхронных Rust приложениях можно обеспечить параллелизм, порождая новую задачу, используя select! или FuturesUnordered. До сих пор мы много говорили про первые два варианта. Я и дальше предлагаю не говорить про FuturesUnordered, так как это частый источник ошибок. При использовании FuturesUnordered легко создавать задачи, ожидая, что они будут работать в фоновом режиме, а затем удивиться, что они не показывают никакого прогресса.

«Имитировать» FuturesUnordered можно с помощью тех же scoped tasks и TaskSet. Это гораздо надёжнее.

let greeting = «Hello».to_string();

task::scope(async |scope| {

    let mut task_set = scope.task_set();

    

    for i in 0..10 {

        task_set.spawn(async {

            println!(»{} from task {}», greeting, i);

            

            i

        });

    }

    

    async for res in task_set {

        println!(«task completed {:?}», res);

    }

});

Каждая порождённая задача выполняется параллельно, заимствуя данные из порождающей задачи, а TaskSet предоставляет API, аналогичный FuturesUnordered. Такие примитивы, как buffered stream, также могут быть реализованы за счёт scoped tasks.

Текущая модель асинхронного Rust не позволяет исследовать другие примитивы параллелизма. Это могло бы стать возможным, если бы мы сделали Rust с гарантированным завершением асинхронных операций (к которому мы пришли в этой статье).

Изменение #5: Добавляем опцию #[abort_safe]

В начале статьи я утверждал, что использование асинхронного программирования позволяет нам эффективно моделировать сложное управление потоком исполнения. Самый эффективный примитив, который у нас есть сегодня, — это select!.. Я ранее предложил в этой статье использовать его, правда только с канальными типами. Но тогда нужно порождать две задачи для каждого соединения — для одновременного чтения и записи. Порождённые задачи действительно помогают предотвратить ошибки при отмене (прерывании) операции. Но попробуем найти более эффективное решение и переписать операцию чтения для случая её неожиданного прерывания.

Например, mini-redis при парсинге фреймов сначала сохраняет полученные данные в буфере. При прерывании операции чтения данные не теряются, потому что они находятся в буфере. Следующий вызов чтения возобновится с того места, где мы остановились. Такую реализацию можно назвать «abort_safe».

Что, если вместо использования select! для канальных типов мы применим abort_safe операции. Такие операции, как приём данных из канала или чтение из буферизованного дескриптора ввода-вывода по умолчанию являются abort_safe. Нам повезло. Но вместо этого мы потребуем, чтобы разработчик явно указывал #[abort_safe] при реализации соответствующей функции. Это более выигрышная стратегия.

#[abort_safe]

#[abort_safe]
async fn read_line(&mut self) -> io::Result<Option<String>> {
    loop {
        // взять всю строку из буфера
        if let Some(line) = self.parse_line()? {
            return Ok(line);
        }

        // в буфере недостаточно данных для парсинга всей строки
        if 0 == self.socket.read_buf(&mut self.buffer)? {
            // удалённый сервер закрыл соединение.
            if self.buffer.is_empty() {
                return Ok(None);
            } else {
                return Err("connection reset by peer".into());
            }
        }
    }
}

Вместо того, чтобы использовать операции abort_safe (с безопасным прерыванием), по умолчанию, мы сделаем это опцией (можно сравнить с opt-in в маркетинге). На такую опцию можно как бы добровольно «подписаться». Когда разработчик знакомится с таким кодом, аннотация сообщает ему, что те и вот эти функции должны быть abort_safe. Компилятор Rust может даже выдавать дополнительные проверки и предупреждения для функций, помеченных #[abort_safe].

Теперь Алан может использовать свою функцию read_line () с «select!», но без канальных типов.

loop {
    select! {
        line_in = connection.read_line()? => {
            if let Some(line_in) = line_in {
                broadcast_line(line_in);
            } else {
                // соединение закрыто, выходим из цикла
                break;
            }
        }
        line_out = channel.recv() => {
            connection.write_line(line_out)?;
        }
    }
}

Учтите, что в коде можно использовать сочетание функций с опцией #[abort_safe] и без неё. Вызов abort_safe функции всегда возможен как из безопасного, так и из небезопасного контекста. Обратное неверно: компилятор Rust предотвратит вызов небезопасных функций безопасного контекста, и выведет соответствующее сообщение об ошибке.

async fn must_complete() { ... }

#[abort_safe]
async fn can_abort() {
    // Invalid call => compiler error
    must_complete();
}
 
async fn must_complete() { ... }

#[abort_safe]
async fn can_abort() {
    // Valid call
    spawn(async { must_complete() }).join();
}

Разработчик всегда может создать новую задачу, чтобы связать небезопасную функцию с безопасным контекстом.

Включение двух разновидностей асинхронных функций усложнит язык, но эта сложность появится на поздних этапах обучения. Нужно начинать изучение асинхронного Rust в небезопасном контексте (без учёта abort_safe). Из этого контекста обучающийся может вызывать асинхронные функции независимо от данной опции. Информация о ней будет доступна в последних, продвинутых, главах руководства по асинхронному Rust.

По крайней мере, вот так я себе это всё представляю.

Светлое будущее

Для перехода от текущей асинхронной модели с abort_safe операциями по умолчанию к модели с гарантированным завершением потребуется существенно доработать Rust. Допустим, все работы будут завершены к 2026 году. Обычные футуры будут изменены на футуры с гарантированным завершением. Вместо этого старые (обычные) футуры в версии 2026 года будут жить под именем AbortSafeFuture.

Именно добавление #[abort_safe] к асинхронным функциям приведёт к появлению AbortSafeFuture вместо старой Future. Любая асинхронная функция, написанная в версиях Rust до 2026 года, должна иметь возможность использовать AbortSafeFuture. Это сделает весь существующий асинхронный код совместимым с новой версией (напомним, что abort_safe функция, может быть вызвана из любого контекста).

Обновление старой кодовой базы языка потребует добавления #[abort_safe] ко всем асинхронным функциям. Это механический процесс, можно легко автоматизировать его. Чтобы добавить поддержку асинхронного Rust с гарантированным завершением в среду исполнения Tokio, её тоже придётся основательно переработать.

Время действовать

Я рассказал о нескольких изменениях, которые, как мне кажется, помогут упростить асинхронное программирование в Rust:

Используем футуры с гарантированным завершением
Отказываемся от .await
Отказываемся от Arc и используем scoped tasks
Отказываемся от FuturesUnordered и расширяем возможности параллелизма
Добавляем опцию #[abort_safe]

Они также помогут усовершенствовать сам механизм выполнения асинхронных операций. Но прежде чем принимать какие-либо решения, нам нужно больше экспериментальных данных. Какой процент сегодняшнего асинхронного кода защищён от нежелательных прерываний?

Можем ли мы провести достаточно исследований, чтобы оценить потенциальную пользу от этих изменений? И наоборот: насколько тяжелее будет изучать и программировать на Rust, если появится два вида асинхронных функций (с опцией abort_safe и без неё)?

Надеюсь, что эта статья также вызовет дискуссию, и, возможно, вы предложите альтернативные решения. Пришло время пробовать самые смелые идеи.

VDS/VPS хостинг с быстрыми NVMе-дисками и посуточной оплатой. Загрузка своего ISO.

Комментарии (45)

Gorthauer87
26.06.2021 15:25
#23193278
+1
Сложно вот так сходу сказать, хорошая это идея или нет, но очень много усложнений и кто знает, какие подводные камни они создают.
И вообще, интуиция прямо подсказывает, что все это костыли, но чтобы доказать это нужно найти слабые места в предложенных изменениях и показать, что все становится только сложнее для всех.

DustCn
26.06.2021 15:34
#23193296
>>Даже поток, который сидит и ничего не делает, использует ценные системные ресурсы.
Какие?
1. Gorthauer87
  26.06.2021 15:39
  #23193302
  Как минимум, место под стэк. А футуры собственный стэк не пользуют.
  1. DustCn
    26.06.2021 20:55
    #23194046
    -2
    Место под стек это ценные системные ресурсы? О_о
    
    MacIn
    26.06.2021 21:19
    #23194108
    +1
    Вообще-то да. Место резервируется под рост и при большом количестве потоков (реалистичный сценарий для 32 битных приложений) можно запросто get virtual addressspace exhausted.
    У меня есть такой проблемный сервер (под NT, не касается Rust, но это абстрактный разговор) — под каждое сосединение (а они keep-alive + временные под http) выделяется поток. 1500 соединений — это, в общем, максимум, что такой сервер может вытянуть. А потом просто жестко падает.
    На NT в 32 битных приложениях вообще reserv'ится стек как для нативной 64 битной части потока, так и для wow64, что еще хуже.
  1. technic93
    27.06.2021 02:39
    #23194674
    Тем не менее футуры тоже должны хранить состояние свое.
    
    mayorovp
    27.06.2021 12:49
    #23195366
    +1
    Футуры требуют столько памяти, сколько им нужно, а не резервируют большие куски на всякий случай.
    
    technic93
    27.06.2021 13:24
    #23195490
    Бывают ещё горутины, там местом под стэк более экономно управляют

MacIn
26.06.2021 20:17
#23193956
Или в случае, когда несколько потоков (одно соединение на один поток) конкурируют за ограниченный ресурс, приходится использовать примитивы синхронизации. Применяя концепцию асинхронности, мы можем добиться более высокой производительности, работая с несколькими соединениями в одном потоке.

Только вот вряд ли у вас будет один поток по кругу обслуживать все соединения. Будет пул потоков, и вон то соединение, с которым вы хотите тоже поработать, может быть «под другим» потоком, а значит, синхронизации все равно не избежать.

PrinceKorwin
26.06.2021 20:21
#23193972
Подскажите, пожалуйста. Какие есть средства у Rust для написания тестов на асинхронный код?
Чтобы не быть как Алан и перед выдачей убедиться в асинхронной безопасности и корректности своего кода?
1. Morgan_iv
  27.06.2021 23:25
  #23194392
  Чтобы не быть как Алан по большей части достаточно помнить, чем отличаются синхронные функции от асинхронных.
  Синхронная функция в скомпилированом виде - это цельный кусок машинного кода. Мы не можем остановить ее выполнение посередине или даже поставить на паузу, если мы не хотим/не можем пользоваться инструментами, которые нам предоставляет ядро (например, таким инструментом будет SIGINT+обработчик, или выведение синхронной функции в отдельный поток, а затем остановка этого потока из другого потока нашей программы)
  Напротив, асинхронная функция - это конечный автомат, по сути - множество синхронных функций с промежуточными точками между ними. Каждая (кроме последней) из этих синхронных функций, представляющих собой этапы выполнения большой асинхронной функции, возвращает нам "Я частично готова, можно пока выполнить что-то еще". Последняя же возвращает сам результат.
  Мы можем прервать выполнение асинхронной функции в любой такой точке, можем послать на исполнение (в т.ч. так же с середины) другую асинхронную или синхронную функцию, а затем вернуться к первой, а когда в Rust завезут async iters - сможем в таких точках получать промежуточные значения и сразу посылать их дальше. С синхронной функцией мы такого сделать не можем.
  Собственно, в этом и есть главный плюс и главный минус асинхронного подхода. С одной стороны, неблокирующее IO благодаря промежуточным точкам. С другой стороны - при неаккуратном использовании можно получить то, что получил автор в первом примере - асинхронная функция выполнилась частично, была остановлена на середине, а поскольку она внутри себя меняла некоторую внешнюю структуру - эта самая внешняя структура была оставлена в неконсистентном состоянии.
  Предложение автора дать асинхронным функциям гарантированное завершение звучит очень странно. Их же как раз делали в т.ч. для того, чтобы можно было спокойно отменить выполнение уже ненужной функции прямо пока она работает, и это было бы нормальным поведением. Предложение отказаться от .await еще хуже - сейчас вызов асинхронной функции без .await означает создание того самого конечного автомата, который можно затем отдать какому-нибудь executor'у, а вызов .await означает создание в текущей асинхронной функции точки останова и встраивание в нее конечного автомата той функции, на которой был вызван .await
  По итогу, статья очень спорная, со странными примерами и (на мой взгляд) плохими предложениями. Алану я бы рекомендовал почитать Async Book - это должно помочь ему не делать таких ошибок на ровном месте
  1. DmitryKoterov
    27.06.2021 01:43
    #23194614
    +1
    Предложение отказаться от .await еще хуже - сейчас вызов асинхронной функции без .await означает создание того самого конечного автомата, который можно затем отдать какому-нибудь executor'у
    Такое нужно в 5% случаев. А в 95% случаев при вызове асинхронной функции перед ней ставят await - можете посмотреть статистику в своем коде. Т.е. по сути надо бы await инвертировать: по дефолту все авейтится, а если хочется получить future (или promise в других языках), то тогда пишем ключевое слово.
    Это наводит на мысль, что ключевое слово вообще нужно только одно - async:
    async перед объявлением функции означает, что она асинхронная
    async перед вызовом функции означает, что не надо ее авейтить, а вместо этого надо вернуть future или promise.
    Я еще могу понять, почему в JS есть два ключевых слова async и await (язык динамически типизированный, и вызвав функцию, нельзя заранее знать, синхронная она или асинхронная). Но почему в статически типизированных языках (в том числе C++20) нельзя обойтись одним ключевым словом? Иначе как инерцией мышления авторов, я не знаю, как это объяснить. Вы знаете?
    P.S.
    Что-то по прочтении данной статьи сложилось удручающее впечатление об асинхронности в Расте. Я, конечно, не растоман ни разу - может, поэтому. Но кажется, что оно куда-то не туда едет совсем.
    
    ilammy
    27.06.2021 05:28
    #23194736
    Но почему в статически типизированных языках (в том числе C++20) нельзя обойтись одним ключевым словом?
    Это имеет меньше отношения к статической типизации и больше к ориентированности на zero-cost abstraction. Явный await каждый раз напоминает, что на этом месте исполнение уходит в нарнию за результатом и вернётся когда-нибудь.
    
    Естественно, компилятор мог бы и сам увидеть, что если с одной стороны Future, а с другой T — то надо вставить await. Точно так же он мог бы и увидеть, что если с одной стороны Result<T, E>, а с другой — T, то можно вставить try! Но он так не делает и вы должны явно писать ?, чтобы развернуть результат с возвратом ошибки.
    
    freecoder_xx
    28.06.2021 13:12
    #23198674
    -1
    Как раз .await в этом примере должен был навести Алана на мысли, что с его кодом что-то не так:
    
    let len = socket.read_u32().await?; let mut line = vec![0; len]; socket.read_exact(&mut line).await?;
    
    Два раза происходит чтение из сокета, причем блок кода выполняется не атомарно, так как в местах вызова .await возможны переключения. Другое дело, если код синхронный:
    
    let len = socket.read_u32()?; let mut line = vec![0; len]; socket.read_exact(&mut line)?;
    
    Тут все в порядке. И если асинхронный код писать также, то проблема будет просто заметена под ковер еще глубже. Да, это не проблема, если требовать обязательного завершения фьючи, но, как уже писали выше, на кой черт тогда вообще сдалась такая асинхронность.
    
    mayorovp
    28.06.2021 13:40
    #23198782
    Извините, а что именно с эти кодом не так? Вы знаете какой-то другой способ прочитать из сокета пакет переменной длины?
    
    Более того, сама реализация read_exact в tokio подвержена той же самой проблеме с отменой операции, так что даже использование буфера фиксированной блины не спасёт!
    
    freecoder_xx
    28.06.2021 15:16
    #23199322
    У меня такое ощущение, что вы бросились мне отвечать не прочитав исходного сообщения, на которое я ответил. Поэтому ваши вопросы звучат как-то странно.
    
    Извините, а что именно с эти кодом не так?
    С ним не так то, что он асинхронный, а не синхронный. А значит в любой момент, где есть .await, может произойти переключение. И хорошо, что .await написан явно, а не заметен под ковер, как предлагает делать автор статьи и поддерживающие его комментаторы.
    
    Как это исправить? Не надо здесь принимать socket по шаренной ссылке (как вариант).
    
    mayorovp
    28.06.2021 15:20
    #23199340
    Но ведь проблема, на которую указано, заключается вовсе не в переключении!
    
    freecoder_xx
    28.06.2021 18:30
    #23200250
    Не нравится термин "переключение" — хорошо, можно сказать боле общо: проблема в прерывании. .await явно показывает, в каком месте может возникнуть прерывание фьючи. Без него подобные ошибки будет проще допустить.
1. mexus
  27.06.2021 13:07
  #23195438
  +2
  для обычных юнит-тестов асинхронного кода есть крайне удобный макрос #[tokio::test]. В tokio, в том числе, можно вручную управлять временем, а в крейте tokio-test есть примитивы для мока I/O, например.
  
  для более глубокой проверки можно воспользоваться инструментом loom

kai3341
27.06.2021 00:32
#23194504
В этом и заключается проблема: любая асинхронная функция Rust может перестать работать в любое время, так как её могут просто прервать.
Вообще-то это стандарт асинхронного программирования. Так ведёт себя асинхронный код везде. И обозначенная в статье проблема решается иначе.
1. mayorovp
  27.06.2021 12:53
  #23195380
  +2
  Нет, это не стандарт.
  
  В C# асинхронную функцию нельзя прервать в произвольном месте. В JavaScript — тоже. В С++ — зависит от возвращаемого типа.
  1. slonopotamus
    27.06.2021 14:25
    #23195654
    +1
    "в произвольном" или всё-таки "в точке await'а"?
    
    mayorovp
    27.06.2021 14:30
    #23195662
    В точке await, разумеется.
    
    Morgan_iv
    28.06.2021 01:07
    #23197268
    Вот и в Rust можно только в точке .await'a, тем более это язык, компилируемый в нативный код - просто взять и из кода приложения сказать виртуалке остановиться не получится, потому что нет ее, этой виртуалки
    
    mayorovp
    28.06.2021 01:47
    #23197340
    Ещё раз повторяю: в C# асинхронную функцию нельзя прервать в произвольной точке await, В JavaScript — тоже.
    
    Что значит "вот и в Rust можно"?

vvadzim
27.06.2021 10:50
#23195024
любая асинхронная функция Rust может перестать работать в любое время, так как её могут просто прервать
Я про асинхронность знаю только из джавасрипта, и в нем асинхронные функции не могут быть прерваны извне никак, только если они сами с ошибкой свалятся.

В расте по умолчанию не так? Там возможны ситуации что асинхронная функция работала-работала, и больше не работает и никогда не завершится?
1. Cerberuser
  27.06.2021 11:26
  #23195098
  Там возможны ситуации что асинхронная функция работала-работала, и больше не работает и никогда не завершится?
  Да, если вызывающая сторона решила, что ей больше не нужен результат выполнения асинхронной функции, и удалила соответствующий Future.

farcaller
27.06.2021 12:35
#23195326
К сожалению, после небольшой переписки в чате сервер вылетает с ошибкой «invalid UTF-8». Теперь Алан не понимает, в чём дело: он проверяет код и не находит ошибок.
Я тоже слегка не понял — значит ли это что в любой точке прерывания (await) функция может закончиться и ее локальный стек пропадет навсегда? Для меня это звучит как очень нелогичное и бессмысленное поведение, в чем тогда вообще профит async/await без гарантии локального фрейма функции?
1. mayorovp
  27.06.2021 12:54
  #23195382
  Функция может закончиться если вызвавший её код решил что результат ему не нужен.
  1. svr_91
    27.06.2021 13:32
    #23195514
    А в данном случае как такое получается? Там есть какойто автогенерируемый код, который забывает про функтор, или автор статьи скрыл от нас какойто кусок кода?
    
    mayorovp
    27.06.2021 13:37
    #23195538
    Ничего он не скрыл. Посмотрите ещё раз на тот код, где используется макрос select!.
    
    Этот макрос принимает две футуры (может больше, но тут две), дожидается окончания любой из них и забывает про другую.
    
    svr_91
    27.06.2021 13:49
    #23195572
    +2
    Ага, тоесть код внутри макроса написан им, это не автогенерируемый код? Фраза написана так, что не понятно, откуда появился этот макрос
1. Gorthauer87
  27.06.2021 13:13
  #23195460
  футура это просто трейт с методом Poll, если его никто не вызывает,то она ничего и не делает. А так как это обычная структура, то ее можно просто взять и дропнуть, тогда она не завершится. Все довольно понятно становится, если все таки посмотреть на внутреннее устройство.
  По сути, нужно писать код, держа в уме те же мысли, что и при написании exception safe кода.
  1. farcaller
    27.06.2021 16:23
    #23195906
    Так понятно, спасибо. Действительно, для меня — привыкшего к nodejs async — это было бы крайне неочевидным поведением, но теперь, посмотрев на это в контексте ownership, стало понятнее.
    
    nin-jin
    30.06.2021 05:28
    #23206048
    В яваскрипте это называется генераторами.

Zanak
27.06.2021 13:45
#23195566
Сразу оговорюсь, я не очень глубоко знаю раст, я его только изучаю. Зато я прилично знаю python, go и js. Поэтому заранее прошу прощения, если с точки зрения раст разработки сморожу глупость.

Писать асинхронный код зачастую сложнее, чем просто использовать потоки.
В чем же? Помечай асинхронные функции и не забывай сообщить "я помню что этот результат нужно подождать" при их вызове. По крайней мере в js и python как — то так. Единственно, я не увидел нигде упоминания о промисах, они уже существуют, или вы о них забыли?
Почему вы противопоставляете асинхронность и параллельность? Это 2 стороны одной медали, кмк. Что выбрать диктует задача, которую вы решаете, но ни как не инструмент. Например, для расчетных задач, где нет большой работы с файлами или сетью и зависимостей между ними потоки могут стать более предпочтительным выбором. Для сервиса — да, асинхронность работает лучше, потому что сеть отвечает не мгновенно, да и человек на том конце соединения может "задуматься". В таком случае имеет смысл отложить задачку и переключиться на что — то еще, пока не придет время вернуться к этой.

Например, приостановку или отмену операции на лету будет сложно реализовать
Стоит ли задумываться о реализации отдельных операций, или все таки рассмотреть механизм коммуникации с сопрограммами, через который и сообщать им о необходимости уснуть или быстро завершиться, подставляя на такие сообщения обработчики по умолчанию, если разработчик их не перекрыл своими?

Изменение #1
Даешь горутины почти в чистом виде? Только в go сопрограмма открывает управляющий канал и ловит команду на завершение от запустившей ее стороны. Произошла ошибка или пришла команда завершиться — аккуратно прибираемся и выходим из сопрограммы.

Явные и неявные вызовы .await
Питонский дзен учит: явное лучше неявного. Следствием этого может оказаться пожелание "не убирать .await".

Изменение #3: Отказываемся от Arc и используем scoped tasks
Здесь уже стоит посмотреть в сторону языка ada. Там, как я вас понял, присутствует что — то похожее. Вдруг окажется интересным, изучить опыт предшественников.

freecoder_xx
28.06.2021 18:31
#23200256
В статье есть ошибка в коде первого примера: операции read_u32 и read_exact вызываются только на мутируемом объекте (&mut TcpStream), а в статье объект заимствуется неизменяемым (&TcpStream).

freecoder_xx
28.06.2021 18:33
#23200266
+2
Оказывается, под капотом, в стеке вызовов, используется макрос select!
Вот этот оборот — "под капотом" — все только запутывает. Нет там никакого "капота", речь про пользовательский же код, который просто находится выше по стеку вызовов. А то складывается впечатление, будто проблема где-то в недрах tokio.

freecoder_xx
28.06.2021 18:54
#23200334
+2
А вот мне интересно, когда Алан писал код
```
select! {
    line_in = parse_line(&socket) => ...
    line_out = channel.recv() => ...
}
```
То он чего ждал? Что программа не будет работать так, как написано? select! и нужен для того, чтобы прерывать выполнение фьюч, а он взял и в него засунул parse_line. Код и сделал то, что его попросили: прервал чтение и парсинг, если channel.recv() завершился быстрее. Вместо этого можно было воспользоваться сначала методом peek у TcpStream для ожидания появления данных в очереди без их удаления. Или вообще переписать эту логику с использованием try_read.
1. mayorovp
  28.06.2021 19:19
  #23200426
  (комментарий был удалён)
1. mayorovp
  28.06.2021 19:21
  #23200432
  А как тут вообще poll_peek использовать, когда задача — именно что дождаться появления данных?
  1. freecoder_xx
    28.06.2021 22:03
    #23200968
    Смысл в том, чтобы с помощь peek дождаться появления нужных данных в очереди — это ожидание и пихать в select!, а вычитать данные уже после, по факту выполнения ветки после ожидания.
    
    mayorovp
    28.06.2021 22:43
    #23201122
    Да, такой вариант возможен, но у него есть трудности с композицией: если у нас есть код, который читает таким образом A, и есть код, который читает таким образом B — вы не можем простым путём получить код, который читает AB.

Metal_Messiah
28.06.2021 21:35
#23200880
+1
Я категорически против того чтобы отказаться от await, именно за это недолюбливаю Kotlin.
Слишком много не очевидной магии. Раст конечно подразумевает много кодогенерации и макрсов, но они обычно явно вызваются. В принципе мне даже не очень нравится что async функции в сигнатуре возврата не указывают футуру, а тип-значения, но это терпимое зло (хотя impl Futute было-бы нагляднее как по мне).
Раст точно слишком близкий к железу чтобы пропускать авейт и безконтрольно авейтить. Следующий пропозал -- сделать все ф-и асинхронными и создать "Грин треды" и прощай статус системного языка.
1. AnthonyMikh
  29.06.2021 14:04
  #23203414
  Я категорически против того чтобы отказаться от await, именно за это недолюбливаю Kotlin.
  А вы можете рассказать, какие это создаёт проблемы?