我正在尝试为Linux上的POSIX计时器系统编写C ++“包装器”,以便我的C ++程序可以使用系统时钟设置事物的超时(例如等待消息通过网络到达),没有处理POSIX丑陋的C接口。它似乎在大多数时间都有效,但偶尔我的程序会在成功运行几分钟后出现段错误。问题似乎是我的LinuxTimerManager对象(或其中一个成员对象)损坏了内存,但不幸的是,如果我在Valgrind下运行程序,问题就会出现,所以我不得不盯着我的代码试图去弄清楚出了什么问题。
这是我的计时器包装器实现的核心:
LinuxTimerManager.h :
@
LinuxTimerManager.cpp :
namespace util {
using timer_id_t = int;
class LinuxTimerManager {
private:
timer_id_t next_id;
std::map<timer_id_t, timer_t> timer_handles;
std::map<timer_id_t, std::function<void(void)>> timer_callbacks;
std::set<timer_id_t> cancelled_timers;
friend void timer_signal_handler(int signum, siginfo_t* info, void* ucontext);
public:
LinuxTimerManager();
timer_id_t register_timer(const int delay_ms, std::function<void(void)> callback);
void cancel_timer(const timer_id_t timer_id);
};
void timer_signal_handler(int signum, siginfo_t* info, void* ucontext);
}
当我的程序崩溃时,段错误始终来自namespace util {
LinuxTimerManager* tm_instance;
LinuxTimerManager::LinuxTimerManager() : next_id(0) {
tm_instance = this;
struct sigaction sa = {0};
sa.sa_flags = SA_SIGINFO;
sa.sa_sigaction = timer_signal_handler;
sigemptyset(&sa.sa_mask);
int success_flag = sigaction(SIGRTMIN, &sa, NULL);
assert(success_flag == 0);
}
void timer_signal_handler(int signum, siginfo_t* info, void* ucontext) {
timer_id_t timer_id = info->si_value.sival_int;
auto cancelled_location = tm_instance->cancelled_timers.find(timer_id);
//Only fire the callback if the timer is not in the cancelled set
if(cancelled_location == tm_instance->cancelled_timers.end()) {
tm_instance->timer_callbacks.at(timer_id)();
} else {
tm_instance->cancelled_timers.erase(cancelled_location);
}
tm_instance->timer_callbacks.erase(timer_id);
timer_delete(tm_instance->timer_handles.at(timer_id));
tm_instance->timer_handles.erase(timer_id);
}
timer_id_t LinuxTimerManager::register_timer(const int delay_ms, std::function<void(void)> callback) {
struct sigevent timer_event = {0};
timer_event.sigev_notify = SIGEV_SIGNAL;
timer_event.sigev_signo = SIGRTMIN;
timer_event.sigev_value.sival_int = next_id;
timer_t timer_handle;
int success_flag = timer_create(CLOCK_REALTIME, &timer_event, &timer_handle);
assert(success_flag == 0);
timer_handles[next_id] = timer_handle;
timer_callbacks[next_id] = callback;
struct itimerspec timer_spec = {0};
timer_spec.it_interval.tv_sec = 0;
timer_spec.it_interval.tv_nsec = 0;
timer_spec.it_value.tv_sec = 0;
timer_spec.it_value.tv_nsec = delay_ms * 1000000;
timer_settime(timer_handle, 0, &timer_spec, NULL);
return next_id++;
}
void LinuxTimerManager::cancel_timer(const timer_id_t timer_id) {
if(timer_handles.find(timer_id) != timer_handles.end()) {
cancelled_timers.emplace(timer_id);
}
}
}
,通常是行timer_signal_handler()
或tm_instance->timer_callbacks.erase(timer_id)
。实际的段错误是从tm_instance->timer_handles.erase(timer_id)
实现的深处(即std::map
)抛出的。
我的内存损坏可能是由修改相同LinuxTimerManager的不同定时器信号之间的竞争条件引起的吗?我以为一次只传递一个定时器信号,但也许我误解了手册页。使Linux信号处理程序修改像stl_tree.h
这样复杂的C ++对象一般是不安全的吗?
答案 0 :(得分:3)
信号可以发生在例如中间。 malloc
或free
因此大多数对容器执行有趣操作的调用可能导致在其数据结构处于任意状态时重新进入内存分配支持。 (正如评论中所指出的,大多数函数在异步信号处理程序中调用是不安全的。malloc
和free
只是示例。)以这种方式重新输入组件会导致几乎任意的失败。 / p>
如果不在库中的任何操作期间阻止整个过程的信号,则无法使库不安全。这样做非常昂贵,无论是管理信号掩码的开销还是信号掩盖的时间量都是如此。 (它必须是整个过程,因为信号处理程序不应该阻塞锁。如果处理信号的线程调用受互斥锁保护的库,而另一个线程持有信号处理程序需要的互斥锁,则处理程序将阻塞。如果发生这种情况,很难避免死锁。)
解决这个问题的设计通常有一个侦听特定事件然后进行处理的线程。您必须使用信号量在线程和信号处理程序之间进行同步。