第25课 std::thread对象的析构

一. 线程的等待与分离

（一）join和detach函数

　　1. 线程等待：join()

　　（1）等待子线程结束，调用线程处于阻塞模式。

　　（2）join()执行完成之后，底层线程id被设置为0，即joinable()变为false。同时会清理线程相关的存储部分，这样 std::thread 对象将不再与已经底层线程有任何关联。这意味着，只能对一个线程使用一次join();调用join()后，joinable()返回false。

　　2. 线程分离：detach()

　　（1）分离子线程，与当前线程的连接被断开，子线程成为后台线程，被C++运行时库接管。这意味着不可能再有std::thread对象能引用到子线程了。与join一样，detach也只能调用一次，当detach以后其joinable()为false。

　　（2）注意事项：

　　　　①如果不等待线程，就必须保证线程结束之前，可访问的数据是有效的。特别是要注意线程函数是否还持有一些局部变量的指针或引用。

　　　　②为防止上述的悬空指针和悬引用的问题，线程对象的生命期应尽量长于底层线程的生命期。

　　（3）应用场合

　　　　①适合长时间运行的任务，如后台监视文件系统、对缓存进行清理、对数据结构进行优化等。

　　　　②线程被用于“发送即不管”（fire and forget）的任务，任务完成情况线程并不关心，即安排好任务之后就不管。

（二）联结状态：一个std::thread对象只可能处于可联结或不可联结两种状态之一。可用joinable()函数来判断，即std::thread对象是否与某个有效的底层线程关联（内部通过判断线程id是否为0来实现）。

　　1. 可联结(joinable)：当线程可运行、己运行或处于阻塞时是可联结的。注意，如果某个底层线程已经执行完任务，但是没有被join的话，该线程依然会被认为是一个活动的执行线程，仍然处于joinable状态。

　　2. 不可联结（unjoinable）：

　　（1）当不带参构造的std::thread对象为不可联结，因为底层线程还没创建。

　　（2）己移动的std::thread对象为不可联结。因为该对象的底层线程id会被设置为0。

　　（3）己调用join或detach的对象为不可联结状态。因为调用join()以后，底层线程己结束，而detach()会把std::thread对象和对应的底层线程之间的连接断开。

【编程对象】等待与分离

#include <iostream>

#include <thread>

using namespace std;

//1. 悬空引用问题

class FuncObject

{

    void do_something(int& i) { cout <<"do something: " << i << endl; }

public:

    int& i;

    FuncObject(int& i) :i(i) {  }

    void operator()()

    {

        for (unsigned int j = ; j < ; ++j)

        {

            do_something(i); //可能出现悬空引用的问题。

        }

    }

};

void oops()

{

    int localVar = ;

    FuncObject fObj(localVar);

    std::thread t1(fObj);

    t1.detach();  //子线程分离，转为后台运行。主线程调用oops函数,可能出现oops函数

                  //执行完了，子线程还在运行的现象。它会去调用do_something，这时会

                  //访问到己经被释放的localVar变量，会出现未定义行为！如果这里改成

                  //join()则不会发生这种现象。因此主线程会等子线程执行完才退出oops

}

//2. 利用分离线程处理多文档文件

void openDocAndDisplay(const std::string& fileName){} //打开文件

bool doneEditing() { return false; } //判断是否结束编辑

enum class UserCommand{OpenNewDocument, SaveDocument,EditDocument}; //命令类型

UserCommand getUserInput() { return UserCommand::EditDocument; } //获取用户命令

string getFilenameFromUser() { return ""; } //获取文件名

void processUserInput(UserCommand cmd){} //处理其它命令

void editDocument(const std::string& fileName)

{

    openDocAndDisplay(fileName);

    while (!doneEditing()) {

        UserCommand cmd = getUserInput();

        if (cmd == UserCommand::OpenNewDocument) { //如果用户选择打开一个新文档

            const string  newName = getFilenameFromUser();

            std::thread t(editDocument, newName);  //启动新线程去处理这个新文档

            t.detach(); //子线程分离。这样主线程就可以继续处理其他任务。

        }else {

            processUserInput(cmd);

        }

    }

}

int main()

{

    //1. 悬空引用问题

    oops();

    //2. 利用分离线程处理多文档文件

    editDocument("E:\\Demo\\abc.doc");

    return ;

}

二. std::thread对象的析构

（一）std::thread的析构

　　1. std::thread对象析构时，会先判断joinable()，如果可联结，则程序会直接被终止（terminate）。

　　2. 这意味std::thread对象从其它定义域出去的任何路径，都应为不可联结状态。也意味着创建thread对象以后，要在随后的某个地方显式地调用join或detach以便让std::thread处于不可联结状态。

（二）为什么析构函数中不隐式调用join或detach？

　　1. 如果设计成隐式join()：将导致调用线程一直等到子线程结束才返回。如果子线程正在运行一个耗时任务，这可能造成性能低下的问题，而且问题也不容易被发现。

　　2. 如果设计成隐式detach()：由于detach会将切断std::thread对象与底层线程之间的关联，两个线程从此各自独立运行。如果线程函数是按引用（或指针）方式捕捉的变量，在调用线程退出作用域后这些变量会变为无效，这容易掩盖错误也将使调试更加困难。因此隐式detach，还不如join或者显式调用detach更直观和安全。

　　3.标准委员会认为，销毁一个joinable线程的后果是十分可怕的，因此他们通过terminate程序来禁止这种行为。为了避免销毁一个joinable的线程，就得由程序员自己来确保std::thread对象从其定义的作用域出去的任何路径，都处于不可联结状态，最常用的方法就是资源获取即初始化技术（RAII，Resource Acquisition Is Initialization）。

（三）std::thread对象与RAII技术的结合

　　1. 方案1：自定义的thread_guard类，并将std::thread对象传入其中，同时在构造时选择join或detach策略。当thread_guard对象析构时，会根据析构策略，调用std::thread的join()或detach()，确保在任何路径，线程对象都处于unjoinable状态。

　　2. 方案2：重新封装std::thread类（见下面的代码，类名为joining_thread），在析构时隐式调用join()。

【编程实验】利用RAII确保std::thread所有路径皆为unjoinable

#include <iostream>

#include <thread>

#include <functional>

#include <algorithm>

using namespace std;

constexpr auto tenMillion = ;

bool conditionsAreSatisfied() { return false;}//return true or false

//问题函数：doWork_oops（没有确保std::thread所有皆为不可联结）

//参数：filter过滤器，选0至maxVal之间的值选择出来并放入vector中

bool doWork_oops(std::function<bool(int)> filter, int maxVal = tenMillion)

{

    std::vector<int> goodVals; //保存经过滤器筛选出来的数值（0-maxVal）

    std::thread t([&filter, maxVal, &goodVals] { //注意goodVals是局部变量，按引用传入子线程。

                    for (auto i = ; i <= maxVal; ++i)

                        if (filter(i))  goodVals.push_back(i);

                });

    if (conditionsAreSatisfied()) { //如果一切就绪，就开始计算任务

        t.join(); //等待子线程结束

        //performComputation(goodVals);  //主线程执行计算任务

        return true;

    }

    //conditionsAreSatisfied()时false，表示条件不满足。（注意，仍没调用join()或detach())

    return  false; //调用线程（一般是主线程）执行到这里，t对象被析构，std::thread的析构函数被调用，

                   //此时由于子线程仍处于可联结状态，将执行std::ternimate终止程序！

                   //为什么std::thread析构函数不隐式执行join或detach，而是终止程序的运行？

                   //如果隐式调用join()会让主线程等待子线程（耗时任务）结束，这会浪费性能。

                   //而如果隐式调用detach会使主线程和子线程分离，子线程由于引用goodVals局部变量，

                   //会出现悬空引用的问题，但这问题又不容易被发现。因此，通过std::ternimate来终止

                   //程序，以便让程序员自己决定和消除这些问题。比如继续调用join()，还是detach(但需

                   //要同时解决悬空引用问题)？

}

//利用RAII技术，确保std::thread的正常析构

class thread_guard  //scoped_thread

{

public:

    enum class DtorAction{join, detach}; //析构行为

    //构造函数只接受右值类型，因为std::thread只能被移动。虽然t为右值引用类型，但由于形参本身

    //左值，因此调用std::move将形参转为右值。

    thread_guard(std::thread&& t, DtorAction a = DtorAction::join):action(a), thr(std::move(t))

    {

    }

    ~thread_guard()

    {

        if (thr.joinable()) //必须校验，join和detach只能被调用一次

        {

            if (action == DtorAction::join) {

                thr.join();

            } else {

                thr.detach();

            }

        }

    }

    std::thread& get() { return thr; }

    //由于声明了析构函数，编译器将不再提供移动操作函数，因此需手动生成

    thread_guard(thread_guard&&) noexcept = default;

    thread_guard& operator=(thread_guard&&) = default;

    //本类不支持复制

    thread_guard(const thread_guard&) = delete;

    thread_guard& operator=(const thread_guard&) = delete;

private:

    //注意action和thr的声明顺序，由于thr被创建以后会执行起来，必须

    //保证action己被初始化。因此先声明action，再声明thr。

    DtorAction action;

    std::thread thr;

};

bool doWork_ok(std::function<bool(int)> filter, int maxVal = tenMillion)

{

    std::vector<int> goodVals;

    std::thread t([&filter, maxVal, &goodVals] { //注意goodVals是局部变量，按引用传入子线程。

        for (auto i = ; i <= maxVal; ++i)

            if (filter(i))

            {

                cout << i << endl;

                goodVals.push_back(i);

            }

        });

    thread_guard guard(std::move(t));//默认析构策略是thread_guard::DtorAction::join

    if (conditionsAreSatisfied()) { //如果一切就绪，就开始计算任务

        guard.get().join(); //等待子线程结束

        //performComputation(goodVals);  //主线程执行计算任务

        return true;

    }

    //conditionsAreSatisfied()时false，表示条件不满足。guard对象析构，但会隐式调std::thread对象

    //的join()。

    return  false;

}

//使用RAII等待线程完成：joining_thread类的实现

class joining_thread

{

    std::thread thr;

public:

    joining_thread() noexcept = default;

    //析构函数

    ~joining_thread()

    {

        if (joinable()) //对象析构造，会隐式调用join()

        {

            join();

        }

    }

    template<typename Callable, typename... Args>

    explicit joining_thread(Callable&& func, Args&& ...args):

        thr(std::forward<Callable>(func), std::forward<Args>(args)...)

    {

    }

    //类型转换构造函数

    explicit joining_thread(std::thread t) noexcept : thr(std::move(t))

    {

    }

    //移动操作

    joining_thread(joining_thread&& other) noexcept : thr(std::move(other.thr))

    {

    }

    joining_thread& operator=(joining_thread&& other) noexcept

    {

        if (joinable()) join(); //等待原线程执行完

        thr = std::move(other.thr); //将新线程移动到thr中

        return *this;

    }

    joining_thread& operator=(std::thread other) noexcept

    {

        if (joinable()) join();

        thr = std::move(other);

        return *this;

    }

    bool joinable() const noexcept

    {

        return thr.joinable();

    }

    void join() { thr.join(); }

    void detach() { thr.detach(); }

    void swap(joining_thread& other) noexcept { thr.swap(other.thr); }

    std::thread::id get_id() const noexcept { return thr.get_id(); }

    std::thread& asThread() noexcept //转化为std::thread对象

    {

        return thr;

    }

    const std::thread& asThread() const noexcept

    {

        return thr;

    }

};

void doWork(int i) { cout << i << endl; }

int main()

{

    //1.问题函数：doWork_oops：没有确保std::thread的所有路径都为joinable

    //doWork_oops([](auto val) { return val >= 100; }, 1000);

    //2. doWork_ok函数

    doWork_ok([](auto val) { return val >= ; }, );

    //3. 测试joining_thread类

    std::vector<joining_thread> threads;  //joining_thread析构时隐式调用join

    for (unsigned int i = ; i < ; ++i) {

        threads.push_back(joining_thread(doWork, i));

    }

    std::for_each(threads.begin(), threads.end(), std::mem_fn(&joining_thread::join));

    return ;

}

秒客网

第25课 std::thread对象的析构

相关文章