第25课 std::thread对象的析构

时间:2024-01-02 20:37:02

一. 线程的等待与分离

(一)join和detach函数

  1. 线程等待:join()

  (1)等待子线程结束,调用线程处于阻塞模式

  (2)join()执行完成之后,底层线程id被设置为0,即joinable()变为false。同时会清理线程相关的存储部分, 这样 std::thread 对象将不再与已经底层线程有任何关联。这意味着,只能对一个线程使用一次join();调用join()后,joinable()返回false。

  2. 线程分离:detach()

  (1)分离子线程,与当前线程的连接被断开,子线程成为后台线程,被C++运行时库接管。这意味着不可能再有std::thread对象能引用到子线程了。与join一样,detach也只能调用一次,当detach以后其joinable()为false

  (2)注意事项:

    ①如果不等待线程,就必须保证线程结束之前,可访问的数据是有效的。特别是要注意线程函数是否还持有一些局部变量的指针或引用

    ②为防止上述的悬空指针和悬引用的问题,线程对象的生命期应尽量长于底层线程的生命期。

  (3)应用场合

    ①适合长时间运行的任务,如后台监视文件系统、对缓存进行清理、对数据结构进行优化等。

    ②线程被用于“发送即不管”(fire and forget)的任务,任务完成情况线程并不关心,即安排好任务之后就不管。

(二)联结状态:一个std::thread对象只可能处于可联结或不可联结两种状态之一可用joinable()函数来判断,即std::thread对象是否与某个有效的底层线程关联(内部通过判断线程id是否为0来实现)。

  1. 可联结(joinable):当线程可运行、己运行或处于阻塞时是可联结的。注意,如果某个底层线程已经执行完任务但是没有被join的话,该线程依然会被认为是一个活动的执行线程,仍然处于joinable状态

  2. 不可联结(unjoinable):

  (1)当不带参构造的std::thread对象为不可联结,因为底层线程还没创建。

  (2)己移动的std::thread对象为不可联结。因为该对象的底层线程id会被设置为0。

  (3)己调用join或detach的对象为不可联结状态。因为调用join()以后,底层线程己结束,而detach()会把std::thread对象和对应的底层线程之间的连接断开。

【编程对象】等待与分离

#include <iostream>
#include <thread> using namespace std; //1. 悬空引用问题
class FuncObject
{
void do_something(int& i) { cout <<"do something: " << i << endl; }
public:
int& i;
FuncObject(int& i) :i(i) { } void operator()()
{
for (unsigned int j = ; j < ; ++j)
{
do_something(i); //可能出现悬空引用的问题。
}
}
}; void oops()
{
int localVar = ;
FuncObject fObj(localVar); std::thread t1(fObj); t1.detach(); //子线程分离,转为后台运行。主线程调用oops函数,可能出现oops函数
//执行完了,子线程还在运行的现象。它会去调用do_something,这时会
//访问到己经被释放的localVar变量,会出现未定义行为!如果这里改成
//join()则不会发生这种现象。因此主线程会等子线程执行完才退出oops
} //2. 利用分离线程处理多文档文件
void openDocAndDisplay(const std::string& fileName){} //打开文件
bool doneEditing() { return false; } //判断是否结束编辑
enum class UserCommand{OpenNewDocument, SaveDocument,EditDocument}; //命令类型
UserCommand getUserInput() { return UserCommand::EditDocument; } //获取用户命令
string getFilenameFromUser() { return ""; } //获取文件名
void processUserInput(UserCommand cmd){} //处理其它命令 void editDocument(const std::string& fileName)
{
openDocAndDisplay(fileName); while (!doneEditing()) {
UserCommand cmd = getUserInput();
if (cmd == UserCommand::OpenNewDocument) { //如果用户选择打开一个新文档
const string newName = getFilenameFromUser();
std::thread t(editDocument, newName); //启动新线程去处理这个新文档 t.detach(); //子线程分离。这样主线程就可以继续处理其他任务。
}else {
processUserInput(cmd);
}
}
} int main()
{
//1. 悬空引用问题
oops(); //2. 利用分离线程处理多文档文件
editDocument("E:\\Demo\\abc.doc");
return ;
}

二. std::thread对象的析构

(一)std::thread的析构

  1. std::thread对象析构时,会先判断joinable(),如果可联结,则程序会直接被终止(terminate)。

  2. 这意味std::thread对象从其它定义域出去的任何路径,都应为不可联结状态。也意味着创建thread对象以后,要在随后的某个地方显式地调用join或detach以便让std::thread处于不可联结状态。

(二)为什么析构函数中不隐式调用join或detach?

  1. 如果设计成隐式join():将导致调用线程一直等到子线程结束才返回。如果子线程正在运行一个耗时任务,这可能造成性能低下的问题,而且问题也不容易被发现

  2. 如果设计成隐式detach():由于detach会将切断std::thread对象与底层线程之间的关联,两个线程从此各自独立运行。如果线程函数是按引用(或指针)方式捕捉的变量,在调用线程退出作用域后这些变量会变为无效,这容易掩盖错误也将使调试更加困难。因此隐式detach,还不如join或者显式调用detach更直观和安全。

  3.标准委员会认为,销毁一个joinable线程的后果是十分可怕的,因此他们通过terminate程序来禁止这种行为。为了避免销毁一个joinable的线程,就得由程序员自己来确保std::thread对象从其定义的作用域出去的任何路径,都处于不可联结状态,最常用的方法就是资源获取即初始化技术RAII,Resource Acquisition Is Initialization)。

(三)std::thread对象与RAII技术的结合

  1. 方案1:自定义的thread_guard类,并将std::thread对象传入其中,同时在构造时选择join或detach策略。当thread_guard对象析构时,会根据析构策略,调用std::thread的join()或detach(),确保在任何路径,线程对象都处于unjoinable状态。

  2. 方案2:重新封装std::thread类(见下面的代码,类名为joining_thread),在析构时隐式调用join()。

【编程实验】利用RAII确保std::thread所有路径皆为unjoinable

#include <iostream>
#include <thread>
#include <functional>
#include <algorithm> using namespace std; constexpr auto tenMillion = ; bool conditionsAreSatisfied() { return false;}//return true or false //问题函数:doWork_oops(没有确保std::thread所有皆为不可联结)
//参数:filter过滤器,选0至maxVal之间的值选择出来并放入vector中
bool doWork_oops(std::function<bool(int)> filter, int maxVal = tenMillion)
{
std::vector<int> goodVals; //保存经过滤器筛选出来的数值(0-maxVal) std::thread t([&filter, maxVal, &goodVals] { //注意goodVals是局部变量,按引用传入子线程。
for (auto i = ; i <= maxVal; ++i)
if (filter(i)) goodVals.push_back(i);
}); if (conditionsAreSatisfied()) { //如果一切就绪,就开始计算任务
t.join(); //等待子线程结束
//performComputation(goodVals); //主线程执行计算任务
return true;
} //conditionsAreSatisfied()时false,表示条件不满足。(注意,仍没调用join()或detach())
return false; //调用线程(一般是主线程)执行到这里,t对象被析构,std::thread的析构函数被调用,
//此时由于子线程仍处于可联结状态,将执行std::ternimate终止程序!
//为什么std::thread析构函数不隐式执行join或detach,而是终止程序的运行?
//如果隐式调用join()会让主线程等待子线程(耗时任务)结束,这会浪费性能。
//而如果隐式调用detach会使主线程和子线程分离,子线程由于引用goodVals局部变量,
//会出现悬空引用的问题,但这问题又不容易被发现。因此,通过std::ternimate来终止
//程序,以便让程序员自己决定和消除这些问题。比如继续调用join(),还是detach(但需
//要同时解决悬空引用问题)?
} //利用RAII技术,确保std::thread的正常析构
class thread_guard //scoped_thread
{
public:
enum class DtorAction{join, detach}; //析构行为 //构造函数只接受右值类型,因为std::thread只能被移动。虽然t为右值引用类型,但由于形参本身
//左值,因此调用std::move将形参转为右值。
thread_guard(std::thread&& t, DtorAction a = DtorAction::join):action(a), thr(std::move(t))
{
} ~thread_guard()
{
if (thr.joinable()) //必须校验,join和detach只能被调用一次
{
if (action == DtorAction::join) {
thr.join();
} else {
thr.detach();
}
}
} std::thread& get() { return thr; } //由于声明了析构函数,编译器将不再提供移动操作函数,因此需手动生成
thread_guard(thread_guard&&) noexcept = default;
thread_guard& operator=(thread_guard&&) = default; //本类不支持复制
thread_guard(const thread_guard&) = delete;
thread_guard& operator=(const thread_guard&) = delete;
private: //注意action和thr的声明顺序,由于thr被创建以后会执行起来,必须
//保证action己被初始化。因此先声明action,再声明thr。
DtorAction action;
std::thread thr;
}; bool doWork_ok(std::function<bool(int)> filter, int maxVal = tenMillion)
{
std::vector<int> goodVals; std::thread t([&filter, maxVal, &goodVals] { //注意goodVals是局部变量,按引用传入子线程。
for (auto i = ; i <= maxVal; ++i)
if (filter(i))
{
cout << i << endl;
goodVals.push_back(i);
}
}); thread_guard guard(std::move(t));//默认析构策略是thread_guard::DtorAction::join if (conditionsAreSatisfied()) { //如果一切就绪,就开始计算任务
guard.get().join(); //等待子线程结束
//performComputation(goodVals); //主线程执行计算任务
return true;
} //conditionsAreSatisfied()时false,表示条件不满足。guard对象析构,但会隐式调std::thread对象
//的join()。
return false;
} //使用RAII等待线程完成:joining_thread类的实现
class joining_thread
{
std::thread thr;
public:
joining_thread() noexcept = default; //析构函数
~joining_thread()
{
if (joinable()) //对象析构造,会隐式调用join()
{
join();
}
} template<typename Callable, typename... Args>
explicit joining_thread(Callable&& func, Args&& ...args):
thr(std::forward<Callable>(func), std::forward<Args>(args)...)
{
} //类型转换构造函数
explicit joining_thread(std::thread t) noexcept : thr(std::move(t))
{
} //移动操作
joining_thread(joining_thread&& other) noexcept : thr(std::move(other.thr))
{
} joining_thread& operator=(joining_thread&& other) noexcept
{
if (joinable()) join(); //等待原线程执行完 thr = std::move(other.thr); //将新线程移动到thr中 return *this;
} joining_thread& operator=(std::thread other) noexcept
{
if (joinable()) join(); thr = std::move(other); return *this;
} bool joinable() const noexcept
{
return thr.joinable();
} void join() { thr.join(); }
void detach() { thr.detach(); } void swap(joining_thread& other) noexcept { thr.swap(other.thr); }
std::thread::id get_id() const noexcept { return thr.get_id(); } std::thread& asThread() noexcept //转化为std::thread对象
{
return thr;
}
const std::thread& asThread() const noexcept
{
return thr;
}
}; void doWork(int i) { cout << i << endl; } int main()
{
//1.问题函数:doWork_oops:没有确保std::thread的所有路径都为joinable
//doWork_oops([](auto val) { return val >= 100; }, 1000); //2. doWork_ok函数
doWork_ok([](auto val) { return val >= ; }, ); //3. 测试joining_thread类
std::vector<joining_thread> threads; //joining_thread析构时隐式调用join
for (unsigned int i = ; i < ; ++i) {
threads.push_back(joining_thread(doWork, i));
} std::for_each(threads.begin(), threads.end(), std::mem_fn(&joining_thread::join)); return ;
}