在探究this question的条件时,出现了一个问题,以下代码举例说明了。
#include <iostream>
#include <thread>
#include <chrono>
#include <stdexcept>
#include <cxxabi.h>
using namespace std;
// mocking external library call stuck in a strictly user-land infinite loop
int buggy_function_simulation()
{
// cout << "In buggy function" << endl; // (1)
int counter = 0;
while (true)
{
if ( ++counter == 1000000 ) { counter = 0; }
}
return 0;
}
int main(int argc, char **argv) {
cout << "Hello, world!" << endl;
auto lambda = []() {
pthread_setcanceltype( PTHREAD_CANCEL_ASYNCHRONOUS, nullptr );
// cout << "ID: "<<pthread_self() <<endl; // (2)
try
{
cout << "ID: "<<pthread_self() <<endl; // (3)
buggy_function_simulation();
}
catch ( abi::__forced_unwind& )
{
cout << "thread cancelled!" << endl; // (4)
throw;
}
};
std::thread th(lambda);
pthread_t id = th.native_handle();
cout << id << endl;
this_thread::sleep_for(chrono::seconds(1));
cout << "cancelling ID: "<< id << endl;
pthread_cancel(id);
th.join();
cout << "cancelled: "<< id << endl;
return 0;
}
编译和运行导致中止:
$ g++ -g -Og -std=c++11 -pthread -o test test.cpp -lpthread
$ ./test
Hello, world!
139841296869120
ID: 139841296869120
cancelling ID: 139841296869120
terminate called without an active exception
Aborted (core dumped)
$
请注意,诊断输出(4)不会出现。
如果我注释掉(3)并取消注释(2),结果是:
$ ./test
Hello, world!
139933357348608
ID: 139933357348608
cancelling ID: 139933357348608
cancelled: 139933357348608
$
同样,(4)的输出未出现(为什么?),但已取消中止操作。
或者,如果我保留(3),将(2)注释掉,然后取消注释(1),则结果最终符合预期:
$ ./test
Hello, world!
139998901511936
ID: 139998901511936
In buggy function
cancelling ID: 139998901511936
thread cancelled!
cancelled: 139998901511936
$
所以,问题是:
为完整起见,这是第一种情况下gdb的堆栈跟踪:
Program terminated with signal SIGABRT, Aborted.
#0 __GI_raise (sig=sig@entry=6) at ../sysdeps/unix/sysv/linux/raise.c:51
51 ../sysdeps/unix/sysv/linux/raise.c: No such file or directory.
[Current thread is 1 (Thread 0x7f5d9b49a700 (LWP 12130))]
(gdb) where
#0 __GI_raise (sig=sig@entry=6) at ../sysdeps/unix/sysv/linux/raise.c:51
#1 0x00007f5d9b879801 in __GI_abort () at abort.c:79
#2 0x00007f5d9bece957 in ?? () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#3 0x00007f5d9bed4ab6 in ?? () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#4 0x00007f5d9bed4af1 in std::terminate() () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#5 0x00007f5d9bed44ba in __gxx_personality_v0 () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#6 0x00007f5d9bc3a708 in ?? () from /lib/x86_64-linux-gnu/libgcc_s.so.1
#7 0x00007f5d9bc3acfc in _Unwind_ForcedUnwind () from /lib/x86_64-linux-gnu/libgcc_s.so.1
#8 0x00007f5d9c1dbf10 in __GI___pthread_unwind (buf=<optimized out>) at unwind.c:121
#9 0x00007f5d9c1d0d42 in __do_cancel () at ./pthreadP.h:297
#10 sigcancel_handler (sig=<optimized out>, si=0x7f5d9b499bb0, ctx=<optimized out>) at nptl-init.c:215
#11 <signal handler called>
#12 buggy_function_simulation () at test.cpp:15
#13 0x0000558865838227 in <lambda()>::operator() (__closure=<optimized out>) at test.cpp:29
#14 std::__invoke_impl<void, main(int, char**)::<lambda()> > (__f=...) at /usr/include/c++/7/bits/invoke.h:60
#15 std::__invoke<main(int, char**)::<lambda()> > (__fn=...) at /usr/include/c++/7/bits/invoke.h:95
#16 std::thread::_Invoker<std::tuple<main(int, char**)::<lambda()> > >::_M_invoke<0> (this=<optimized out>)
at /usr/include/c++/7/thread:234
#17 std::thread::_Invoker<std::tuple<main(int, char**)::<lambda()> > >::operator() (this=<optimized out>)
at /usr/include/c++/7/thread:243
#18 std::thread::_State_impl<std::thread::_Invoker<std::tuple<main(int, char**)::<lambda()> > > >::_M_run(void) (
this=<optimized out>) at /usr/include/c++/7/thread:186
#19 0x00007f5d9beff66f in ?? () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#20 0x00007f5d9c1d26db in start_thread (arg=0x7f5d9b49a700) at pthread_create.c:463
#21 0x00007f5d9b95a88f in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:95
答案 0 :(得分:6)
如果从标记为noexcept
的函数内部抛出该消息,则可以触发该消息。所有析构函数都是隐式的noexcept
,因此,如果在引发pthread_cancel
触发的异常时线程正在运行析构函数,则程序将终止并收到该消息。
operator<<
的 std::cout
是格式化输出操作,它构造一个sentry
对象,该对象在退出时被破坏(请参见https://en.cppreference.com/w/cpp/named_req/FormattedOutputFunction)。如果在处理sentry
对象的析构函数的同时取消,则将终止您的应用程序。
请勿在C ++中使用PTHREAD_CANCEL_ASYNCHRONOUS
。由于从pthread_cancel
子句自动重新抛出,甚至根本不使用catch
也是有问题的。
更新:
pthread_cancel
是POSIX C函数,旨在与C代码一起使用。它有两种操作模式:同步和异步。
pthread_cancel
的同步使用在目标线程上设置一个内部标志,然后在POSIX文档中检入标记为取消点的某些功能。如果目标线程调用了这些函数中的任何一个,则触发取消。在Linux上,这是通过使用不能捕获和丢弃的C ++异常机制引发特殊异常来完成的。这将触发堆栈展开,调用C ++析构函数并运行在pthread_cleanup_push
中注册的代码。假设没有尝试捕获和丢弃异常,这与常规C ++代码兼容。如果所有捕获块都重新抛出,那么一切都会按预期进行。如果取消开始于标记为noexcept
的函数(例如析构函数,默认情况下为noexcept
)内,则程序将终止。
pthread_cancel
的异步使用是不同的。这会向目标线程发送一个特殊信号,该信号会在任意任意点中断目标线程,并开始上述堆栈展开过程。这更加危险,因为代码可能正在评估任意表达式的中间,因此应用程序数据的状态定义得不够好。
如果对设计用于支持它的代码使用异步取消,那么可以。通过谨慎地使用pthread_setcancelstate
来禁用特定区域中的取消,并使用pthread_cleanup_push
来注册取消清除处理程序,可以使代码异步取消安全,但这并非在所有情况下都可以做到。
对于同步取消,如果声明为noexcept
的函数未调用任何取消点函数,则一切正常。使用异步取消,所有代码是潜在的取消点,因此在输入任何标记为noexcept
的代码之前,必须调用pthread_setcancelstate
以暂时取消禁用取消,否则,如果在该函数运行时收到取消信号,则由于取消异常,将调用terminate
。如上所述,这包括所有未明确标记为noexcept(false)
的析构函数。
因此,在使用异步取消时,任何对任意C ++库代码的调用(因此可能会使用析构函数构造C ++对象)都具有潜在的危险,并且必须调用pthread_setcancelstate
来禁用在创建的任何代码块周围的取消带有析构函数的C ++对象,和/或无法控制的对C ++库代码的调用(例如标准库函数)。