Ещё один способ отстрелить себе ногу, используя std::thread / forpes.ru

Главная
Ещё один способ отстрелить себе ногу, используя std::thread

Ещё один способ отстрелить себе ногу, используя std::thread +9

19.03.2019 20:56

igorsemenov 27 4100 Источник

Стандарт C++11 принёс в язык стандартный механизм поддержки тредов (их часто называют потоками, но это создаёт путаницу с термином streams, так что я буду использовать оригинальный англоязычный термин в русской транскрипции). Однако, как и любой механизм в C++, этот несёт в себе ряд хитростей, тонкостей и совершенно новых способов отстрелить себе ногу. Недавно на Хабре появлялся перевод статьи про 20 таких способов, но список этот исчёрпывающим не является. Я хочу рассказать ещё об одном таком способе, связанном с инициализацией экземпляров std::thread в конструкторах классов.

Вот простой пример использования std::thread:

class Usage {
 public:
  Usage() : th_([this](){ run(); }) {}
  void run() {
    // Run in thread
  }
 private:
  std::thread th_;
};

В этом простейшем примере код выглядит корректным, но есть одно любопытное НО: в момент вызова конструктора std::thread экземпляр класса Usage ещё не сконструирован полностью. Таким образом, Usage::run() может быть вызван для экземпляра, часть полей которого (объявленных после поля std::thread) ещё не инициализированы, что, в свою очередь, может привести к UB. Это может быть достаточно очевидно на небольшом примере, где код класса умещается в экран, но в реальных проектах этот капкан может быть припрятан за развесистой структурой наследования. Немного усложним пример для демонстрации:

class Usage {
 public:
  Usage() : th_([this](){ run(); }) {}
  virtual ~Usage() noexcept {}
  virtual void run() {}
 private:
  std::thread th_;
};

class BadUsage : public Usage {
 public:
  BadUsage() : ptr_(new char[100]) {}
  ~BadUsage() { delete[] ptr_; }
  void run() {
    std::memcpy(ptr_, "Hello");
  }
 private:
  char* ptr_;
};

На первый взгляд, код тоже выглядит вполне нормально, более того, он и работать почти всегда будет как ожидается… до тех пор, пока звёзды не сложатся так, что BadUsage::run() вызовется раньше, чем инициализируется ptr_. Чтобы это продемонстрировать, добавим крошечную задержку перед инициализацией:

class BadUsage : public Usage {
 public:
  BadUsage() : ptr_((std::this_thread::sleep_for(std::chrono::milliseconds(1)), new char[100])) {}
  ~BadUsage() { delete[] ptr_; }
  void run() {
    std::memcpy(ptr_, "Hello", 6);
  }
 private:
  char* ptr_;
};

В этом случае вызов BadUsage::run() приводит к Segmentation fault, а valgrind жалуется на обращение к неинициализированной памяти.

Чтобы избежать таких ситуаций, есть несколько вариантов решения. Самый простой вариант — использовать двухфазную инициализацию:

class TwoPhaseUsage {
 public:
  TwoPhaseUsage() = default;
  ~TwoPhaseUsage() noexcept {}
  void start() { th_.reset(new std::thread([this](){ run(); })); }
  virtual void run() {}
  void join() {
    if (th_ && th_->joinable()) {
      th_->join();
    }
  }
 private:
  std::unique_ptr<std::thread> th_;
};

class GoodUsage : public TwoPhaseUsage {
 public:
  GoodUsage() : ptr_((std::this_thread::sleep_for(std::chrono::milliseconds(1)), new char[100])) {}
  ~GoodUsage() noexcept { delete[] ptr_; }
  void run() {
    std::memcpy(ptr_, "Hello", sizeof("Hello"));
  }
 private:
  char* ptr_;
};

// ...
GoodUsage gu;
gu.start();
std::this_thread::sleep_for(std::chrono::milliseconds(100));
gu.join();
// ...

Комментарии (27)

GrimMaple
20.03.2019 00:01
#19911584
Чтобы избежать таких ситуаций, есть несколько вариантов решения.

Эм… и где они? Я как-то подсознательно ожидал листинга способов или разбор плюсов и минусов того или иного способа, но вы их даже не предоставили. Как-то даже немного обидно получилось :(
1. igorsemenov Автор
  20.03.2019 00:03
  #19911594
  Я представил самый простой вариант. Честно говоря, изначально в статье был ещё вариант с запуском треда и ожиданием на condition_variable, но я не увидел у него преимуществ по сравнению с обычной двухфазной инициализацией и удалил.
  1. GrimMaple
    20.03.2019 00:22
    #19911694
    Если начать серьезно занудствовать, то мне вариант с двойной инициализацией не нравится хотя бы тем, что нарушает SRP и инкапсуляцию, предоставляю какую-никакую информацию о своей реализации, что не очень архитектурно красиво :)
    Edit: впрочем, местами может быть оправдано, например в случае запуска сервера или еще чего-то, где метод start() будет частью интерфейса.
    
    igorsemenov Автор
    20.03.2019 00:33
    #19911740
    Ну, если занудствовать, то треды вообще слабо вписываются в ООП. ))

KanuTaH
20.03.2019 00:27
#19911724
+1
```
class Usage {
 public:
  Usage() : th_([this](){ run(); }) {}
  virtual ~Usage() noexcept {}
  virtual void run() {}
 private:
  std::thread th_;
};
```
Вообще это частный случай более общего антипаттерна с вызовом виртуального метода из конструктора, просто, скажем так, опосредованным образом.
1. igorsemenov Автор
  20.03.2019 00:36
  #19911748
  Честно говоря, не очень понял. В общем случае если вызвать виртуальный метод из конструктора, будет просто применено статическое связывание вместо динамического. В данном же случае вызывается именно run() из производного класса, что и приводит к проблемам.
  Если я что-то не понял в комментарии, поясните пожалуйста.
  1. KanuTaH
    20.03.2019 00:45
    #19911780
    Честно говоря, не очень понял. В общем случае если вызвать виртуальный метод из конструктора, будет просто применено статическое связывание вместо динамического.
    
    В общем случае да, «ничего такого» не произойдет, но это не то, для чего существуют виртуальные методы. Поэтому по-хорошему вызовы виртуальных методов из конструктора и деструктора — это антипаттерн.
  1. KanuTaH
    20.03.2019 01:35
    #19911878
    Кстати, в Java с этим все еще «круче», там же все методы виртуальные, кроме final. Пример:
    
    public class Base { public Base() { System.out.println("Base()"); Method(); } protected void Method() { System.out.println("Method() from Base"); } } public class Derived extends Base { private int Field = 10; public Derived() { System.out.println("Derived()"); System.out.println("Field = " + Field); } @Override protected void Method() { System.out.println("Method() from Derived"); System.out.println("Field = " + Field); } } [...] Derived d = new Derived();
    
    выведет:
    
    Base()
    Method() from Derived
    Field = 0 < — даже инициализатор при объявлении еще не сработал
    Derived()
    Field = 10
    
    Уот так уот. Нога простреливается на изичах — «ну как же так, я же инициализировал эту переменную даже не в конструкторе, а аж при объявлении, откуда тут NPE???» От верблюда.
    
    В C#, кстати, было бы примерно то же, но Field в Method() from Derived уже был бы 10. И то радует.
    
    Deosis
    20.03.2019 08:41
    #19912532
    В C# инициализация полей происходит до вызова конструктора.
    Поэтому отстрелить ногу можно и там.
    Например, вызвав конструктор объекта раньше статического конструктора.
    
    TimurNes
    20.03.2019 10:17
    #19913012
    Каким образом вы собираетесь вызвать конструктор объекта раньше статического конструктора?
    Static Constructors
    
    A static constructor is called automatically to initialize the class before the first instance is created or any static members are referenced.
    
    Deosis
    20.03.2019 12:55
    #19914354
    public class Program { public static void Main(string[] args) { //Your code goes here Console.WriteLine("from main:" + Some.what); } public class Some{ public static readonly Some instance = new Some(); public static readonly string what = "Hello, world!"; static Some(){ Console.WriteLine("From static: " + what); } public Some(){ Console.WriteLine("From ctor:" + what); } } }
    
    Онлайн компилятор говорит, что конструктор объекта вызывается раньше:
    
    From ctor: From static: Hello, world! from main:Hello, world!
    
    TimurNes
    20.03.2019 13:10
    #19914482
    Да, действительно, вы правы. Это частный случай, когда экземпляр класса является статическим полем/свойством этого же класса.
    Получается, что по приведенной выше ссылке Microsoft себе противоречит, но здесь описывает правильно:
    Static Classes and Static Class Members
    
    Static members are initialized before the static member is accessed for the first time and before the static constructor, if there is one, is called.

NightShad0w
20.03.2019 00:49
#19911790
Двухфазная инициализация в языке с RAII — знатный антипаттерн. (За исключением специальных случаев и весомых причин, само собой.) Означенная проблема с тредом — проблема архитектуры класса. Тред не является частью логики класса и нарушает SRP. Правильнее и чище держать класс отдельно, с интерфейсом пригодным быть использованным в треде. И тестировать проще, чем с тредами возиться в тестах.
Утрированный пример(откуда следует, что низкоуровневыми примитивами лучше вообще не пользоваться в пользу std::async()):
```
struct A{
 void use(){};
}

...
A a;
std::thread th(&A::use, a); 
do_other_job();
th.join();
```
1. kmansoft
  20.03.2019 10:07
  #19912970
  Без двухфазного "чего-нибудь" здесь не обойтись — так устроен язык, в каждом "слое" вызова конструкторов объект имеет ещё "только" тот класс, кострукторы которого уже вызваны.
  
  Чтобы сделать чище — можно операцию запуска thread сделать другим классом / объектом, и тогда вызывающий код будеть выглядеть вот так:
  
  public class Base { public: Base(); //... public class Run { public: Run(Base& base) { // здесь создаём thread, вызываем виртуальную base.run() } } protected: virtual void run(); } public class Sub : public Base { //... } // клиенты Sub sub(....); Base.Run run(sub);
  
  Но вообще использование thread из конструктора стекового объекта мне кажется очень странным, даже если бы не было derived классов. И вот почему.
  
  Время жизни стекового объекта определяется структурой вызывающего кода. Он может быть разобран (destroyed) очень быстро.
  
  А нам нужно чтобы время жизни было достаточным для завершения асинхронной (работающей на thread-е) работы, иначе зачем там вообще thread?
  
  Можно вызывать thread::join() из деструктора, но тогда будет синхронное ожидание завершения того что делает thread, снова бессмысленно.
  
  А если не вызывать join() то вызовется terminate() и рабочий thread может прерваться в неподходящем месте, скажем после открытия какого-то файла но до его закрытия. Опять плохо.

mk2
20.03.2019 00:50
#19911792
Кстати, похожие проблемы могут появиться в Java — при работе с потоками в конструкторе.
А именно — если у объекта есть final поля, то гарантируется, что после вызова конструктора их значения будут правильными для всех потоков. Но это неверно, если ссылка на объект была куда-то (например в другой поток) передана внутри конструктора.

einstein_man
20.03.2019 01:16
#19911848
У std::thread есть default constructor.
На мой взгляд более простое решение — просто запустить поток в теле конструктора, там уже все members проинициализированы.
И не забыть, что деструктор std::thread позовет terminate, если не сделать join к нему (или detach).
И unique_ptr тоже не нужен, ибо есть operator=, который сделает move.

Примерно так: onlinegdb.com/By5-qJkuN
```
#include <thread>
#include <string>
#include <iostream>

struct test_t
{
    test_t()
        : str_{"hello world"}
    {
        t_ = std::thread([this]{
            std::cout << "str = " << str_ << std::endl;
        });
        t_.detach();
    }
    
private:
    std::thread t_;
    std::string str_;
};

int main()
{
    test_t t;
    getchar();

    return 0;
}
```
1. KanuTaH
  20.03.2019 02:07
  #19911950
  Если вы собираетесь внутри лямбды, переданной в std::thread, вызывать виртуальные методы из test_t (как делает автор в оригинальном коде), то это не спасет, вы точно так же отстрелите себе ногу по самые яйца.
  1. einstein_man
    20.03.2019 02:22
    #19911974
    Не собираюсь.
    Комментирую оригинальный посыл статьи, про рождение тредов из initialization list конструктора.
    
    Тема вызова виртуальных функций из конструктора — не связана с «как отстрелить себе ногу с std::thread».

bogolt
20.03.2019 01:20
#19911858
Особенно прекрасно будет если из конструктора базового класса вылетит исключение, а потом вызовется run() у уже удаленного ( а точней даже и не созданного ) объекта.

raiSadam
20.03.2019 09:35
#19912796
Полагаю, что разделение runnable объектов и самих тредов, частично решит проблему. Т.е. в схеме BaseRunnable::run() -> DervedRunnable::run(), а потом std::thread(&Derived::run, derived) не должно быть проблем.

multiprogramm
20.03.2019 11:39
#19913660
Насколько я понял, это просто фундаментальные ошибки. Если убрать треды из обоих верхних примеров, то проблема никуда не уйдёт.
Вызывать функцию класса из списка инициализации для поля можно только такую, которая использует лишь поля класса, что были уже инициализированы (и стоят выше этого поля).
Вызывать виртуальные функции из конструктора и деструктора вообще нельзя (вызов ведёт на ещё не построенный или уже разрушенный «верхний этаж»).
1. igorsemenov Автор
  20.03.2019 11:43
  #19913680
  Вызывать виртуальные функции из конструктора и деструктора вообще нельзя (вызов ведёт на ещё не построенный или уже разрушенный «верхний этаж»).
  
  Не ведёт, т.к. применяется статическое связывание вместо динамического. Это уже обсуждалось в комментариях выше.
  Хотя, в целом скорее соглашусь — проблема не завязана только на треды. Я лишь описываю достаточно типичный случай, когда с этой проблемой можно столкнуться, используя треды.
  1. multiprogramm
    20.03.2019 12:39
    #19914230
    +1
    Посмотрел стандарт — хм, да, действительно, не ведёт. Согласен. Спасибо, буду знать.

grand_fruit

20.03.2019 12:41

#19914252

Как по мне все проблемы исчезают, если мы будем использовать функтор вместо класса с run методом.

#include <thread>

class Runner
{
public:
	void operator()()
	{
		// Do some staff
	}
};

class ScopedThread
{
public:
	ScopedThread(std::thread&& aThread)
		: myThread(std::move(aThread))
	{

	}

	~ScopedThread()
	{
		if (myThread.joinable())
			myThread.join();
	}
private:
	std::thread myThread;
};

void main()
{
	Runner()(); // Runs in current thread
	ScopedThread(std::thread{ Runner()}); // Runs in separate thread 
}

Sazonov
20.03.2019 13:16
#19914520
Согласен. Кстати, в Qt так и рекомендуют делать с их потоками. Там чуть другое апи, но суть та же.

Antervis
20.03.2019 13:58
#19914820
в 2019-м году реализовывать свой thread класс с виртуальным методом run — моветон неслыханный. Вместо наследования от такого AbstractThread и переопределения run можно просто создать std::thread, параметризованный лямбдой.
1. igorsemenov Автор
  20.03.2019 14:04
  #19914858
  Так я и не рекламирую такой способ. Конечно, при написании нового кода есть варианты получше. ;)

Ещё один способ отстрелить себе ногу, используя std::thread +9

Комментарии (27)

igorsemenov Автор

igorsemenov Автор

igorsemenov Автор

igorsemenov Автор

igorsemenov Автор