Просто не копируй это / forpes.ru

Главная
Просто не копируй это

Просто не копируй это +28

30.09.2024 19:37

dalerank 75 36000 Источник

То, о чем я собираюсь рассказать в статье настолько тривиально, что любой, даже начинающий, разработчик уже это знает - я правда очень на это надеюсь. Тем не менее, приходящий на ревью код, показывает, что люди как делали, так и продолжают делать что-то подобное:

bool LoadAnimation(str::string filename);
void DrawLines(std::vector<Points> path);
Matrix RotateObject(Matrix m, Angle angle);
int DrawSprite(Sprite sprite);

Что общего у этих функций? Аргумент по значению. И каждый раз, когда вызывается подобный функционал в коде, создается копия входных данных в своем временном контексте и передается внутрь функции. И можно еще простить редко вызываемый код, вроде загрузки анимаций или понадеяться на компилятор, что сработают оптимизации и он уничтожит копирование данных, но как назло, чаще всего такой подход к разработке уничтожает только перформанс и фпсы.

К любым оптимизациям надо подходить только! после анализа их в профайлере, копии как оказалось могут и не быть дорогой операцией. Это например зависит от размера объекта, так компилятор отлично справляется с передачей по значению объектов до 32 байт, расходы конечно есть, но они очень незначительные и не ловятся на бенчмарках. Вендор может накрутить "чего-то такого в платформу и компилятор", что копирование 32кб из специальных областей памяти будет быстрее, чем сложение пары чисел. А в самой игре оптимизация "горячего кода", будем говорить честно, часто является не самой большой проблемой общей производительности. Но вот динамическое выделении памяти может преподнести немало сюрпризов, особенно при бездумном применении.

Но даже если накладные расходы небольшие, есть ли смысл тратить процессорные циклы, когда можно этого избежать? Вот эти "потерянные 2-3%" размазанного перфа, которые даже в профайлере не светятся, очень трудно потом ловить, и еще труднее чинить.

Скрытая алокация на строках

#include <string>
#include <numeric>

size_t PassStringByValueImpl(std::string str) {
    return std::accumulate(str.begin(), str.end(), 0, [] (size_t v, char a) { 
        return (v += (a == ' ') ? 1 : 0);
    });
}

size_t PassStringByRefImpl(const std::string& str) {
    return std::accumulate(str.begin(), str.end(), 0, [] (size_t v, char a) { 
        return (v += (a == ' ') ? 1 : 0);
    });
}

const std::string LONG_STR("a long string that can't use Small String Optimization");

void PassStringByValue(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = PassStringByValueImpl(LONG_STR);
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(PassStringByValue);

void PassStringByRef(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = PassStringByRefImpl(LONG_STR);
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(PassStringByRef);

void PassStringByNone(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = 0;
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(PassStringByNone);

QuickBench: https://quick-bench.com/q/f6sBUE7FdwLdsU47G26yPOnnViY

Скрытая алокация на массивах

size_t SumValueImpl(std::vector<unsigned> vect)
{
    size_t sum = 0;
    for(unsigned val: vect) { sum += val; }
    return sum;
}

size_t SumRefImpl(const std::vector<unsigned>& vect)
{
    size_t sum = 0;
    for(unsigned val: vect) { sum += val; }
    return sum;
}

const std::vector<unsigned> vect_in = { 1, 2, 3, 4, 5 };

void PassVectorByValue(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = SumValueImpl(vect_in);
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(PassVectorByValue);

void PassVectorByRef(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = SumRefImpl(vect_in);
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(PassVectorByRef);

void PassVectorByNone(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = 0;
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(PassVectorByNone);

QuickBench: https://quick-bench.com/q/GU68xgT0r97eYaCKxMzm9bXJei4

Компилятор все равно умнее

В случаях, если копируемый объект занимает размер меньше пары тройки десятков байт мы вообще не заметим никакой разницы от передачи его по ссылке, вплоть до того, что сгенерированный ассемблерный код будет "почти одинаковым".

Копирование есть, но не влияет

struct Vector{
    double x;
    double y;
    double z;
};

double DotProductObjectImpl(Vector a, Vector p){
    return (a.x*p.x + a.y*p.y + a.z*p.z);
}

double DotProductRefImpl(const Vector& a, const Vector& p){
    return (a.x*p.x + a.y*p.y + a.z*p.z);
}

void DotProductObject(benchmark::State& state) {
    Vector in = {1,2,3};
    for (auto _ : state) {
        double dp = DotProductObjectImpl(in, in);
        benchmark::DoNotOptimize(dp);
    }
}
BENCHMARK(DotProductObject);

void DotProductRef(benchmark::State& state) {
    Vector in = {1,2,3};
    for (auto _ : state) {
        double dp = DotProductObjectImpl(in, in);
        benchmark::DoNotOptimize(dp);
    }
}
BENCHMARK(DotProductRef);

void DotProductNone(benchmark::State& state) {
    for (auto _ : state) {
        size_t n = 0;
        benchmark::DoNotOptimize(n);
    }
}
BENCHMARK(DotProductNone);

QuickBench: https://quick-bench.com/q/drlH-a9o4ejvWP87neq7KAyyA8o

В этом примере нам конечно известен размер структуры, да и пример очень простой. С другой стороны, если передача по ссылке явно работает не медленнее таковой по значению, использование const& будет "such best as we can". А передача примитивных типов по const& и вообще ни на что не влияет при компиляции с флагом /Ox

А раз нет никаких преимуществ, писать что-то подобное const int &i лишено смысла, но некоторые всеже пишут.

Reserve my vector

Массивы имеют огромное преимущество по сравнению с другими структурами данных, которое зачастую перекрывает любые удобства других контейнеров: их элементы следуют в памяти один за другим. Можно долго обсуждать влияние применяемого алгоритма на время работы и как это может повлиять на производительность, но ничего быстрее кешлиний процессора у нас нет, и чем больше элементов лежит в кеше, тем быстрее будет работать самый банальный перебор. Любое обращение за пределы L1 кеша сразу кратно увеличивает время работы.

Но работая с векторами (динамическими массивами) многие забывают, или не помнят, что там под капотом. А там если закончилось выделенное место, а оно было например выделено для 1 (одного) элемента, то:

Выделяется новый блок памяти, который больше.
Копируются все элементы, которые были сохранены в новый блок.
Удаляется старый блок памяти

Все эти операции затратные, очень быстрые, но все равно затратные. И происходят они под капотом и не видны:
- если не лазить смотреть код стандартной библиотеки
- не смотреть профайлером алокации
- доверять коду, который написан вендором (хотя тут придется принять вещи как они есть)

Use reserve, Luke

static void NoReserve(benchmark::State& state) 
{
  for (auto _ : state) {
    // create a vector and add 100 elements
    std::vector<size_t> v;
    for(size_t i=0; i<100; i++){  v.push_back(i);  }
    benchmark::DoNotOptimize(v);
  }
}
BENCHMARK(NoReserve);

static void WithReserve(benchmark::State& state) 
{
  for (auto _ : state) {
    // create a vector and add 100 elements, but reserve first
    std::vector<size_t> v;
    v.reserve(100);
    for(size_t i=0; i<100; i++){  v.push_back(i);  }
    benchmark::DoNotOptimize(v);
  }
}
BENCHMARK(WithReserve);

static void CycleNone(benchmark::State& state) {
  // create the vector only once
  std::vector<size_t> v;
  for (auto _ : state) {
    benchmark::DoNotOptimize(v);
  }
}
BENCHMARK(CycleNone);

QuickBench: https://quick-bench.com/q/OuiFp3VOZKNKaAZgM_0DkJxRock

Ну и напоследок пример того, как можно убить перф и получить просадку до 10 FPS на ровном месте, просто при движении мышкой по игровому полю. Движок называть не буду, баг уже пофиксили. Найдете ошибку, пишите в коменты :)

bool findPath(Vector2 start, Vector2 finish) {
   ...

   while (toVisit.empty() == false) 
   {
      ...

      if (result == OBSTACLE_OBJECT_IN_WAY)
      {
         ...

         const std::vector<Vector2> directions{ {1.f, 0.f}, {-1.f, 0.f}, {0.f, 1.f}, {0.f, -1.f} };
         for (const auto& dir : directions)
         {
            auto nextPos = currentPosition + dir;
            if (visited.find(nextPos) == visited.end())
            {
               toVisit.push({ nextPos, Vector2::DistanceSq(center, nextPos) });
            }
         }
      }
   }
}

Комментарии (75)

Sazonov
30.09.2024 19:48
#27360764
+3
Про копирование 32кб памяти которые до этого не были в кэше и которое быстрее суммы двух чисел можете поподробнее, с примерами? А то заучит как-то волшебно.

И почему вы в бенчмарках используете копирование вместо обращения по ссылке в range for?
1. dalerank Автор
  30.09.2024 19:48
  #27360830
  +1
  могу рассказать конкретно про nintendo switch, через API SDK (это поддержка со стороны железа всегда) можно выделить область памяти которую следует скопировать, работало как для gpu так и для cpu. Происходит это в обход cpu и это не шареная память gpu-cpu, происходило именно копирование данных. Так например было сделано сохранение предыдущего фрейма для разных пост эффектов. Еще навскидку nontemporal memcopy в обход кеша, который конечно не сложение двух чисел, но тоже сильно быстрее обычного. Про бенчи, там стейт небольшой смысла его через реф делать нет, но если очень хочется то почему бы и не сделать.
  1. unreal_undead2
    30.09.2024 19:48
    #27361684
    Происходит это в обход cpu
    
    И такое копирование работало при передаче обычного плюсового вектора по значению?
1. Deosis
  30.09.2024 19:48
  #27361438
  +2
  Я могу предположить два способа сделать "копию" данных сильно быстрее честного копирования:
  
  Отображение разных страниц виртуальной памяти на одну физическую (например, fork). Работает очень быстро пока не понадобится записать в скопированную или оригинальную память.
  
  DMA, процессор отдает команду на копирование данных, которую периферия будет выполнять асинхронно.
  1. Sazonov
    30.09.2024 19:48
    #27361764
    И обе этих вещи не являются частью стандарта и соответственно, не кросс-платформенны.
    
    Aldrog
    30.09.2024 19:48
    #27362824
    +5
    Скажем, процессорный кэш тоже не является частью стандарта, но тем не менее примерно все разработчики, которых беспокоит производительность, стараются его учитывать.
    
    Вообще, опираясь только на стандарт и не завязываясь на фичи конкретных платформ, о производительности крайне мало что можно сказать.
    
    Sazonov
    30.09.2024 19:48
    #27365334
    +1
    Для процессорного кэша вам не нужно писать специальный код или использовать платформенные SDK.
    
    Aldrog
    30.09.2024 19:48
    #27367008
    Для эффективного использования кэша нужно писать специальный код. А платформенные SDK в теории могут использоваться в реализации std::vector под эту платформу (примеров не назову, но стандарт не запрещает, до тех пор пока API не меняется).
  1. PrinceKorwin
    30.09.2024 19:48
    #27361830
    это же другими словами copy-on-write, не? Нормальный подход.

TheDestr
30.09.2024 19:48
#27360876
По поводу ошибки в последнем примере:

Скрытый текст
Из очевидного. Не хватает словечка static перед const я полагаю. Но не верится что это могло дать такую просадку.
Хотелось бы прочитать больше о таких же тривиальных советах к обозначенным проблемам. По типу, создать вектор под заранее известный или ожидаемый размер ячеек. Или в каких случаях стоит использовать врапперы по типу std::array.

Если такие ошибки делаются, то конечно нужно обсуждать.

Спасибо за статью.
1. dalerank Автор
  30.09.2024 19:48
  #27360894
  Вы правы насчет ошибки, оно и есть, но даже так оно будет афектить пусть и не так сильно. Подскажу немного, карта размером 300х300 тайлов, не самая большая скажем, попробуйте пройти условно от одного угла до другого, обойти препятствия и т.д.
  1. TheDestr
    30.09.2024 19:48
    #27360944
    Вы намекаете на расширение toVisit ?
    
    Но мне показалось тут ошибка в том, что нужно применять эвристику и нормальный алгоритм поиска. А тут как будто почти брутфорс. Но это уже багой не назвать. Хотя может быть это все есть под многоточием...

Revertis
30.09.2024 19:48
#27360880
+1
Как раз модель владения в Расте заставляет передавать переменные по ссылке, либо явно копировать с помощью clone().
1. KanuTaH
  30.09.2024 19:48
  #27361124
  Неа. В расте его типичная фейковая мув-семантика - это как раз большой любитель делать memcpy() "под капотом". Пример:
  
  struct S { i: i32 } fn foo(s: S) { println!("{:p}", &s); } fn main() { let s = S{ i: 100 }; println!("{:p}", &s); foo(s); }
  
  Запускаем и видим, что напечатались разные адреса, а это означает, что где-то произошел memcpy(). Так что никто никого не "заставляет", если об этом специально не заботиться, то будут все те же грабли.
  1. goglom
    30.09.2024 19:48
    #27361626
    +1
    Как будто вы тут в заблуждение вводите. Очевидно что move для структур с тривиальными типами в полях ничем не будет отличаться от copy. Но это обычно и не создаёт проблем (но опять же, если дурак будет по значению жирные структуры подавать, то ни rust, ни c++ тут не спасут).
    
    Если бы в примере использовалась бы структура владеющая дин. памятью, то тут бы implicit move дал бы выйгрыш по числу аллокаций по сравнению с C++, где для того же эффекта надо было бы звать для аргумента std::move явно
    
    KanuTaH
    30.09.2024 19:48
    #27361950
    +3
    Как будто вы тут в заблуждение вводите.
    
    Да неужели.
    
    Очевидно что move для структур с тривиальными типами в полях ничем не будет отличаться от copy.
    
    А вот оратору выше это явно не очевидно, он утверждает, что "модель владения раста чего-то там заставляет". Модель владения раста ни разу не "заставляет" передавать жирные структуры или, скажем, массивы со стека по ссылке, ей на это по-фи-гу, погромист должен следить за этим сам.
    
    goglom
    30.09.2024 19:48
    #27362744
    +5
    Я всё таки имел ввиду, что в р*ст c implicit move и borrow check не позволит вам сделать вот такую вещб:
    
    fn foo(Vec<i32> x) { !println("{}", x); } fn main () { let x = vec![1, 2, 3]; foo(x); // ... smth foo(x); // compilation failed }
    
    Хотя в C++ аналогичный код скомпилируется, и сделает две лишние аллокации. А в р*сте надо как минимум в первую функцию добавить x.clone() , чтобы скомпилировать, а во вторых из-за implicit move будет всё равно на аллокацию меньше чем в С++, т.к. там explicit move для lvalue.
    
    И мне кажется, что "оратор выше" как раз это и имел в виду, что implicit move в rust всё таки тяготит пргромистов либо явно копирование звать, либо принимать что-то по ссылке.
    
    И на практике, я довольно таки много мест в рабочем проекте на C++ подчищал за неумелыми погромистами, которых не смущало передавать вектор в фу-ию по значению, чисто для readonly целей
  1. mayorovp
    30.09.2024 19:48
    #27362052
    Вы так пишете, как будто в каком-нибудь С++ аналогичный код сделает меньше копирований памяти:
    
    struct S { int i; } void foo(S s) { std::cout << &s << std::endl; } fn main() { S s = ...; std::cout << &s << std::endl; foo(std::move(s)); }
    
    KanuTaH
    30.09.2024 19:48
    #27362610
    Вы так пишете, как будто в каком-нибудь С++ аналогичный код сделает меньше копирований памяти
    
    Нет, я как раз так не пишу. Спор с выдуманным утверждением оппонента - это типичный случай подмены тезиса :) И в C++ и в расте погромист должен думать над механизмом передачи параметров, если хочет производительности.
    
    mayorovp
    30.09.2024 19:48
    #27366500
    Подмену тезиса я вижу как раз у вас. Типы String, Vec и им подобные перемещаются? Перемещаются.
    Почему вы вообще ожидаете перемещение типа, не содержащего ни одной ссылки - не понимаю.
    
    KanuTaH
    30.09.2024 19:48
    #27367862
    Комментарий, на который я отвечал: "модель владения в Расте заставляет передавать переменные по ссылке, либо явно копировать с помощью clone()". Я: "нет, не заставляет, вот контрпример, который не заставляет делать ни того, ни другого, а просто втихую делает memcpy() под капотом, что в случае больших структур или массивов будет больно". Вы: "вы так говорите, как будто в C++ не так". Видите? Вы сами придумали мне какой-то тезис, и начали со мной бороться на этом поле, хотя я такого ни разу не утверждал, это вы сами придумали и приписали мне, а в моем комментарии про C++ вообще не было ни слова. Ладно, не интересно.
    
    mayorovp
    30.09.2024 19:48
    #27367946
    Комментарий был написан не в вакууме, а в ответ на статью.

feelamee
30.09.2024 19:48
#27360964
а есть какие-нибудь советы как это подружить с расширением классов?

Я обычно полагаюсь на размер при передаче в функцию, но если в будущем класс будет расширен.. То уже не уверен стоит ли принимать даже 8 байтовый тип по значению
1. Abstraction
  30.09.2024 19:48
  #27362624
  Написать в функции static_assert(sizeof(DataCollection) <= 16, "redesign to reference if DataCollection grows");, как простейшая соломка?
  1. Aldrog
    30.09.2024 19:48
    #27362874
    +6
    Гораздо важнее проверять is_trivially_copyable. Передачу по значению сруктуры из десятка интов компилятор, думается, сможет как-нибудь оптимизировать.
  1. feelamee
    30.09.2024 19:48
    #27363428
    да, как возможное решение, но overcomplicated как мне кажется.
    
    Тогда уж можно прийти к созданию in, out шаблонных структур, которые будут делать выбор в зависимости от размера. Так делается в cppfront вроде бы
    
    Abstraction
    30.09.2024 19:48
    #27363468
    +2
    Если при дизайне функции разработчик принял решение о передаче по значению на основании чего-то, и ожидает что в свете будущих изменений это "что-то" может поплыть, то задокументировать это что-то кодом мне кажется хорошей идеей. Речь не о том чтобы сделать решение, которое останется правильным всегда, речь о том, чтобы заметить что прошлый-я стал неправ и какие-то мысли надо передумывать.
1. dalerank Автор
  30.09.2024 19:48
  #27363508
  +1
  Как бы не странно звучал совет, лучше писать код как вы его видите на текущий момент. Попытки что-то соптимизровать имеют смысл если есть толковый архитект, который держит все части движка в голове. Сейчас, имхо, важнее получить фичу обкатать её в поле, а если будут проблемы уже вернуться к улучшайзингу.
  1. voldemar_d
    30.09.2024 19:48
    #27363890
    А ещё можно профилировщиком измерить, является ли сомнительное место определяющим по просадке производительности. А то можно потратить кучу времени на ускорение куска кода в 10 раз (это же на порядок, ого-го!), который исполняется всего один процент времени в общем исполнении программы.
    
    Abstraction
    30.09.2024 19:48
    #27364040
    +4
    Преждевременная оптимизация - конечно зло.
    
    Преждевременное отсутствие оптимизации, однако, зло тоже - если потери размазаны тонким слоем по половине кодовой базы, то в профиле они перестают выглядеть как потери.
    
    voldemar_d
    30.09.2024 19:48
    #27364236
    И всё же, профилировщик - самый важный инструмент. Всё, что Вы пишете, тоже важно. Про всё это есть неплохая книга "Курт Гантерот: Оптимизация программ на C++. Проверенные методы повышения производительности".
    
    unreal_undead2
    30.09.2024 19:48
    #27365960
    Копипастить код - тоже зло )
1. unreal_undead2
  30.09.2024 19:48
  #27367894
  стоит ли принимать даже 8 байтовый тип по значению
  
  На современных архитектурах влезает в регистр, по ссылке всячески будет дороже.

Cheater
30.09.2024 19:48
#27361010
Кто такой toVisit? В строке с push() похоже на вызов конструктора копирования вместо perfect forwarding.

Ещё предположу, что распухает visited (если это некое множество посещённых точек, в которое только кладут данные, но не удаляют) и постоянный поиск в нём ухудшает производительность. Я вижу, что на каждом шаге происходит попытка добавления в toVisit 4 точек вокруг данной, не знаю что с ними за кадром потом делается, надеюсь многие выкидываются, но если не делается ничего и просто для каждой точки в toVisit в свою очередь рекурсивно исследуются 4 точки вокруг и т.д., то в результате может получиться весьма дорогой алгоритм.
1. dalerank Автор
  30.09.2024 19:48
  #27361116
  +3
  Спойлер
  А темповая алокация/деалокация в вектор этих четырёх точек на каждой итерации вас не смутила?
1. mayorovp
  30.09.2024 19:48
  #27362046
  Оно там исследуется конечно же, только не рекурсивно, а итеративно. Обратите внимание на внешний цикл.
  1. voldemar_d
    30.09.2024 19:48
    #27363898
    А оно вообще когда из этого внешнего цикла выходит?
    
    mayorovp
    30.09.2024 19:48
    #27366526
    Разумеется, как только стек (или очередь) toVisit исчерпается. В показанном фрагменте кода этого не видно, но лично мне очевидно что первая же строчка внутри тела цикла забирает из toVisit очередной элемент.

simplepersonru
30.09.2024 19:48
#27361172
+4
Такая сигнатура с передачей по значению позволяет мувать в функцию, но при этом остается вариант с копией. Например:

void setSomeSh(std::shared_ptr<Resource> ptr) {

m_some = std::move(ptr);

}

Вызывающий код может передать туда lvalue, или rvalue

std::shared_ptr<Resource> myPtr;

setSomeSh(myPtr)

setSomeSh(std::move(myPtr));

В случае конст ссылки всегда будет лишний инкремент шареда, даже если его можно было избежать, сигнатура со значением дает выбор.

Сори что без кодэблоков, пишу с телефона
1. mentin
  30.09.2024 19:48
  #27362062
  +1
  А когда не надо мувать - то лучше передать view-тип, опять же по значению.
  
  Получаем один из двух вариантов
  
  foo(std::string arg) // если внутри m_arg_ = std::move(arg) foo(std::string_view arg) // eсли сохранять не надо
  
  Вариант с const std::string& хуже последнего - чтобы передать простую С-строчку придется конструировать std::string. В общем, в современном С++ чаще всего аргументы по ссылкам передавать не надо.
  1. voldemar_d
    30.09.2024 19:48
    #27363906
    Даже если передаётся вектор на мегабайт?
    
    mentin
    30.09.2024 19:48
    #27364424
    +2
    Да, конечно.
    
    Если функции нужна своя копия этого массива, то в случае аргумента константная ссылка вы всегда копируете. А передавая массив по значению вы даёте вызывающему возможность избежать копирования содержимого, используя std::move при вызове.
    
    Если копия не нужна, то лучше передавать std::span, он будет передаваться по значению, но копироваться понятно будет только два указателя, а не содержимое вектора.
    
    То есть const std::vector& почти всегда хуже, чем выбор из std::vector и std::span по обстоятельствам.
    
    voldemar_d
    30.09.2024 19:48
    #27364450
    Чем конкретно const std::vector& хуже, чем std::span? Особенно, если я не собираюсь его никуда копировать внутри функции.
    
    Если внутри функции нужна копия, мне придётся её и из std::span копировать. Ну и в чем разница?
    
    mentin
    30.09.2024 19:48
    #27364596
    +1
    Если внутри функции нужна копия, то вы принимаете не std::span, а std::vector по значению, и делаете ему std::move, избегая копирования.
    
    voldemar_d
    30.09.2024 19:48
    #27365590
    А если мне надо, чтобы содержимое вектора осталось и там, откуда он передавался, и копия его оказалась внутри функции? Хотите сказать, что и в таком случае копирования не будет?
    
    mentin
    30.09.2024 19:48
    #27365606
    +2
    Чудес не бывает, если необходимо скопировать - данные придется копировать.
    
    Но сигнатура принимающая std::vector по значению даст вам гибкость - если надо чтобы у вызывающего остался свой вектор, то он использует foo(v), а если ему своя версия не нужна - то он сделает foo(std::move(v)) и обойдется без копирования. Также, это позволить вызывать foo с временным вектором, например foo({1, 2, 3}) без копирования содержимого вектора после его конструирования.
    
    Сигнатура принимающая const std::vector& - не даст вызывающему такой гибкости, копирование будет всегда. Даже в случае foo({1, 2, 3}) будет ненужное копирование временной переменной. То есть сигнатура по значению при правильном использовании не хуже чем по ссылке, и иногда лучше.
    
    voldemar_d
    30.09.2024 19:48
    #27365616
    А всё-таки, чем const std::vector& хуже, чем std::span?
    
    mentin
    30.09.2024 19:48
    #27365628
    +3
    std::span позволит принимать любой совместимый тип, не только std::vector, но и std::initializer_list, или std::array, или C-шный массив. Всё это без копирования. Аргумент типа const std::vector& потребует создания вектора и копирования содержимого во всех случаях кроме собственно вектора. Зачем? Просто не надо требовать более строгого типа, чем вы используете.
    
    P.S. Конечно это всё это верно только если внутри вы просто используете элементы и вам не нужен именно std::vector, например чтобы передать какому-нибудь legacy API.
    
    voldemar_d
    30.09.2024 19:48
    #27365638
    Просто не надо требовать более строгого типа, чем вы используете
    
    Иногда строгая типизация как раз нужна, чтобы избежать лишних ошибок. Этак можно с шаблонами написать T вместо типа и передавать туда всё, что угодно (скомпилируется ли это - другой вопрос).
    
    А ещё можно забыть при вызове написать std::move.
    
    mentin
    30.09.2024 19:48
    #27365708
    +2
    А ещё можно забыть при вызове написать std::move.
    
    Да, по хорошему copy-constructor вектора должен быть explicit, чтобы не пропускать случайного копирования, но к сожалению это ключевое слово появилось слишком поздно.
    
    Ну а пока между шансами забыть std::move, и невозможностью добавить std::move когда надо - я выбираю первое.
    
    voldemar_d
    30.09.2024 19:48
    #27365714
    std::span, кстати, есть не у всех. Бывает, что до сих пор люди вынуждены не использовать C++20 по каким-то (например, корпоративным) требованиям, а "живут" на C++17.
    
    mayorovp
    30.09.2024 19:48
    #27366540
    Иногда строгая типизация как раз нужна, чтобы избежать лишних ошибок. Этак можно с шаблонами написать T вместо типа и передавать туда всё, что угодно (скомпилируется ли это - другой вопрос).
    
    Только вот std::span - вполне себе строгий тип, это никак не какой-то там T. Каких таких ошибок вы пытаетесь избежать принимая вместо него vector?
    
    Требование минимального достаточного контракта от входных данных всегда было хорошей практикой программирования, и оно никак не противоречит строгой типизации.
    
    trnc
    30.09.2024 19:48
    #27368800
    Сигнатура принимающая const std::vector& - не даст вызывающему такой гибкости, копирование будет всегда.
    
    Не совсем понял, разве вот в следующем коде будет копирование вектора при передаче в foo?
    
    #include <vector> #include <iostream> void foo(const std::vector<int>& v) { std::cout << "foo vec: " << static_cast<const void*>(&v) << std::endl; std::cout << "foo vec[0]: " << static_cast<const void*>(&v[0]) << std::endl; } int main() { std::vector<int> myvec{1,2,3}; std::cout << "main vec: " << std::hex << static_cast<void*>(&myvec) << std::endl; std::cout << "main vec[0]: " << std::hex << static_cast<void*>(&myvec[0]) << std::endl; foo(myvec); }
    
    P.S. Я вовсе не плюсовик, просто казалось понимал как работают ссылки..
    
    mentin
    30.09.2024 19:48
    #27369668
    +2
    Выше предлагалось передавать std::vector в случае когда внутри функции нужно оставить себе переданный вектор. Если не надо - то std::span.
    
    Фраза "копирование будет всегда" относится к первому случаю. Если вы принимаете const std::vector& - то чтобы оставить себе вектор, его надо скопировать. А если вы принимаете std::vector то достаточно сделать ему std::move в свою переменную.
    
    voldemar_d
    30.09.2024 19:48
    #27368938
    Сигнатура принимающая const std::vector& - не даст вызывающему такой гибкости, копирование будет всегда. Даже в случае foo({1, 2, 3}) будет ненужное копирование временной переменной.
    
    Честно говоря, не понимаю, с чего бы это. Можете дать пример кода, в котором при таком подходе копирование будет всегда?
    
    mentin
    30.09.2024 19:48
    #27369710
    +2
    Искусственный пример, но достаточен.
    
    Напомню, что std::vector я предлагал использовать когда нужно оставить себе версию массива. И вот тут обходится без копирования, только конструирование в main():
    
    static std::vector<int> y; void foo(std::vector<int> x) { y = std::move(x); } int main() { foo({1, 2, 3}); }
    
    А вот тут мы вынуждены копировать внутри foo(), и никак это обойти передавая по константной ссылке нельзя:
    
    static std::vector<int> y; void foo(const std::vector<int>& x) { y = x; } int main() { foo({1, 2, 3}); }
    
    voldemar_d
    30.09.2024 19:48
    #27370254
    Пример хороший, но и правда искусственный. В жизни лично мне как-то не приходится такие вещи делать. Обычно я в функцию передаю const-ссылку на вектор только для того, чтобы внутри прочитать из него значения и как-то их использовать (возможно, не все - например, осуществить поиск по вектору), а не копировать весь вектор куда-то. В таком случае никаких лишних копирований не происходит.

LaRN
30.09.2024 19:48
#27361422
Тут не рассмотрен момент, когда нужно обеспечить иммутабельность переданных данных. Передача по ссылке имеет кучу побочки, которую трудно отследить. Это почти как глобальные переменные. В одном месте случайно поменял, а выстрелило в другом. У нас был кейс, когда в одной функции переданный по ссылке объект удалили, сделали ему free. А потом чуть ниже из-за этого все палало с AV за пределами этой функции.
1. 8street
  30.09.2024 19:48
  #27361788
  +1
  const ссылка не спасает?
  1. LaRN
    30.09.2024 19:48
    #27361902
    Спасает. Только об этом не сказано в статье. Там как-то однобоко. Минусы описаны, а плюсы нет.
    
    AbuMohammed
    30.09.2024 19:48
    #27362540
    +3
    У меня при ревью есть несколько звоночков, которые прямо в регекспы оформил.
    
    Неконстантная ссылка. В 4 из 5 случаев это сопровождается косяками.
    
    Указатель вместо ссылки. То же самое, плюс еще явные проблемы с дезайном.
    
    A(A&&)=default; как ни странно но очень часто тащит сложно вылавливаемые проблемы.
    
    Ну и вишенка на торте - auto вместо auto&. Помню в продакшене долго ловил чужой баг, связанный с этим).
    
    dalerank Автор
    30.09.2024 19:48
    #27362672
    +1
    Я не уверен насчет pvs, cppxheck точно не ловит такое, может @Andrey2008подскажет умеет ли pvs ловить такие потенциально ошибки

orefkov
30.09.2024 19:48
#27361610
+5
Если вызываемый собирается завладеть переданным, то передача по значению позволяет передавать универсально - копией или перемещением. Понятно, что у себя вызываемый всегда будет мувать переданное. Ну и при многопоточке - локальное значение гарантированно только твое и не нуждается в синхронизации. И компилятор знает, что никто снаружи к этому объекту не имеет ссылок.

redfox0

30.09.2024 19:48

#27361716

писать что-то подобное const int &i лишено смысла

Линтер раста на подобное ругается:

warning: this argument (4 byte) is passed by reference, but would be more efficient if passed by value (limit: 8 byte)
 --> src/main.rs:4:16
  |
4 | fn func(value: &i32) {
  |                ^^^^ help: consider passing by value instead: `i32`
  |
  = help: for further information visit https://rust-lang.github.io/rust-clippy/master/index.html#trivially_copy_pass_by_ref
note: the lint level is defined here
 --> src/main.rs:3:8
  |
3 | #[warn(clippy::trivially_copy_pass_by_ref)]
  |        ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^      ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

vesper-bot
30.09.2024 19:48
#27362016
С интом понятное дело, но претензии в статье на string или более весомые типы данных. Плюс современный int короче современного void*

Vladime
30.09.2024 19:48
#27362508
+2
Here are a few potential performance issues in the provided C++ code:
1. Reallocation of directions vector:
  The std::vector directions is being initialized inside the loop on each iteration. This causes memory allocation and deallocation, which can be avoided by moving the initialization outside the loop:
```
const std::vector directions{ {1.f, 0.f}, {-1.f, 0.f}, {0.f, 1.f}, {0.f, -1.f} };
while (!toVisit.empty()) 
{
    ...
}
```
2. Costly visited.find(nextPos) calls:
  Checking for nextPos in visited every time within the loop can be expensive depending on the size of visited. If visited is an unordered set, this is average O(1) but can degrade to O(n) in worst cases. If it is an ordered set, the lookup is O(log n). Consider if optimizing this lookup or how visited is structured can help improve performance (e.g., hashing Vector2 more efficiently).
3. Possible excessive dynamic memory allocation:
  The toVisit.push({nextPos, Vector2::DistanceSq(center, nextPos)}) creates a temporary object for nextPos and the calculated distance. Depending on the structure of toVisit, this might result in frequent memory allocations if it's dynamically growing.
4. Vector2::DistanceSq recalculations:
  You’re calculating the squared distance between center and nextPos in each iteration. If this calculation is redundant or repeated for the same points, you could store the result of Vector2::DistanceSq in a cache if the computation is expensive.
5. Inefficient toVisit container:
  If toVisit is a priority queue (like in A* or Dijkstra algorithms), using an inefficient data structure for this can slow down the overall algorithm. A heap-based priority queue might be more efficient for pushing and popping elements in such a pathfinding context.
Addressing these points should help reduce unnecessary overhead and improve the overall performance of your pathfinding code.
1. KanuTaH
  30.09.2024 19:48
  #27362750
  +2
  Possible excessive dynamic memory allocation:
  The toVisit.push({nextPos, Vector2::DistanceSq(center, nextPos)}) creates a temporary object for nextPos and the calculated distance. Depending on the structure of toVisit, this might result in frequent memory allocations if it's dynamically growing.
  
  Кстати, забавное утверждение. Да, здесь действительно создается потенциально лишний временный объект, и, возможно, если у toVisit есть аналог emplace, то стоило бы использовать его, но как это связано с "frequent memory allocations" у toVisit "if it's dynamically growing"? Это же разные, никак не связанные вещи. AI (я так понимаю, это он "наобъяснял") в своем репертуаре.

lgorSL
30.09.2024 19:48
#27363020
Моя теория что могло пойти не так:
Скрытый текст
Вместо целых чисел используются float и входные данные могут быть не целыми. По алгоритму не понятно, может он аккуратно написан и для нецелых чисел будет работать нормально. Если нет - он не дойдёт до фишина и оббежит всё-всё поле. Бонусом на вход может прихать бесконечность или Nan.

Не понятно, откуда берётся center в строчке Vector2::DistanceSq(center, nextPos). Если это какая-то вариация алгоритма A* и toVisit это очередь с приоритетами, то по-идее там должна быть точка finish. Иначе A* скатится до обычного неэффективного перебора по площади вместо построения прямого пути и сложность будет пропорциональна квадрату расстояния от startPos до finishPos, а не самому расстоянию.

const std::vector<Vector2> directions{ {1.f, 0.f}, {-1.f, 0.f}, {0.f, 1.f}, {0.f, -1.f} }; for (const auto& dir : directions) Временный вектор создаётся по много раз. Интересно, а если склеить в одну конструкцию, то будет хорошо? Типа for(const Vector2& dir: {{1.f, 0.f}, ... }) { Я сварщик не настоящий, на С++ почти не пишу, но помню что {} это что-то типа std::initializer_list и возможно компилятору будет так удобнее сделать оптимизации.

ImagineTables
30.09.2024 19:48
#27363476
Интересно, а как бы вы отнеслись к тому, если бы в C++ по умолчанию class-параметры (и, может быть, stuct-) были ссылочными, а для копирования, наоборот, надо было бы писать кракозябру? (Не &, потому что теперь только путаница возникнет, а, скажем, T^.
1. KanuTaH
  30.09.2024 19:48
  #27363532
  А ссылочными с какой категорией конкретно (в плане lvalue/rvalue) они бы тогда были бы?
  1. ImagineTables
    30.09.2024 19:48
    #27363688
    l. Если нам почти всегда нужно классическое void foo(const std::string& s);, то почему требуется написать больше символов, чем для редко действительно нужного void foo(std::string s);?
    
    KanuTaH
    30.09.2024 19:48
    #27363748
    Тогда бы к ним ещё "автомагически" добавлялся и const, ибо temporary нельзя прибиндить к неконстантной lvalue ссылке, верно? И надо было бы объяснять, почему тут:
    
    void foo(T arg) { T var; var = ... // OK arg = ... // Not OK }
    
    существует какая-то разница, притом что arg и var выглядят совершенно одинаково ("ну, понимаешь, это такой специальный случай, который нельзя понять, а можно только запомнить...").
    
    P.S. А как быть с шаблонами, которые должны принимать как class types, так и basic types в зависимости от ситуации? Разрешить всегда рисовать эту закорючку, если погромист хочет непременно принимать все по значению? Ну не знаю, такое.
    
    ImagineTables
    30.09.2024 19:48
    #27363886
    Ну это же действительно очень специальный случай. Настолько, что люди спрашивают на SO, можно ли реюзать параметры в качестве обычных переменных.
    
    KanuTaH
    30.09.2024 19:48
    #27363952
    +1
    А стоит ли плодить очередные "специальные случаи" с одинаковым синтаксисом, но "неявно кардинально разной" семантикой? C++ и так офигенно богатый язык, мда. Что касается реюзания параметров - и такое тоже бывает. К тому же, если из параметра предстоит перемещать, а шаблон с универсальной ссылкой в данном месте по каким-то причинам неудобен, то всегда можно сделать передачу параметра по значению и потом из него перемещать, это "естественным образом" работает и с temporary, и с копией обычной переменной, и с перемещением из обычной переменной через std::move(). Конечно, это не годится, если перемещение должно быть "при условии", типа как у try_emplace(), но если нет, то норм.

domix32
30.09.2024 19:48
#27363938
+1
как-то так и появились std::*view и std::*span

Просто не копируй это +28

Компилятор все равно умнее

Reserve my vector

Комментарии (75)

dalerank Автор

dalerank Автор

dalerank Автор

dalerank Автор

dalerank Автор