pthread等待状态并不总是在信号上唤醒

时间:2013-05-27 04:37:52

标签: c linux multithreading pthreads

我目前正在使用条件变量来同步两个线程(pthreads)并且我得到了一个意外的行为,即使我已经验证了一个线程已经在等待一个条件,它也不会在另一个线程发出信号的情况下被唤醒

值得注意的是,我已经在桌面环境中运行它,并且它按预期运行,但是当我使用uclibc在嵌入式环境中运行程序时会出现此问题。

要进行故障排除,我将我的代码剥离到执行锁定/解锁/信令的两个线程,如下所示:

#include <stdio.h>
#include <pthread.h>
#include <stdbool.h>

pthread_mutex_t mutex1 = PTHREAD_MUTEX_INITIALIZER;
pthread_mutex_t mutex2 = PTHREAD_MUTEX_INITIALIZER;
pthread_cond_t condition1 = PTHREAD_COND_INITIALIZER;
pthread_cond_t condition2 = PTHREAD_COND_INITIALIZER;
bool predicate1 = false;
bool predicate2 = false;

static void * ThreadFunc2(void * arg) {
    sleep(1);    // For testing purposes, ensures this thread is run after Thread1

    pthread_mutex_lock(&mutex2);
    while(1) {
        pthread_mutex_lock(&mutex1);
        // Do some work - Eg receive some data from a socket
        predicate1 = false;
        pthread_cond_signal(&condition1);
        pthread_mutex_unlock(&mutex1);

        predicate2 = true;
        while(predicate2 == true)
            pthread_cond_wait(&condition2, &mutex2);

        // Do some more work - Eg send response data to socket
    }
}

static void * ThreadFunc1(void * arg) {
    int result;

    pthread_mutex_lock(&mutex1); 
    while(1) {
        predicate1 = true;
        while(predicate1 == true)
            pthread_cond_wait(&condition1, &mutex1);

        // Do some work - Eg process data on the socket and prepare response data to be sent
        pthread_mutex_lock(&mutex2);
        predicate2 = false;
        pthread_cond_signal(&condition2);
        pthread_mutex_unlock(&mutex2);
    }
}

int main(int argc, char * argv[]) {
    pthread_t thread1Id, thread2Id;

    pthread_create(&thread1Id, NULL, ThreadFunc1, NULL);
    pthread_create(&thread2Id, NULL, ThreadFunc2, NULL);

    while(1) {
        sleep(1);
    }

    return 0;
}

如果我排除了与mutex2 / condition2 / predicate2相关的所有语句,则两个线程按预期方式一起工作。

使用上面列出的代码,在很短的时间之后(因为所有工作都被剥离,每个循环运行得非常快),即使Threadfunc2发出信号通知,ThreadFunc1中的wait on条件1也不会唤醒,导致应用程序正在运行停止。

为了帮助我调试,我重新定义了pthread_ *函数,在调用实际的pthread_ *函数之前,使用匹配的行号将消息打印到stdout。这使我能够跟踪每个pthread操作的流程,并验证信号是否已经发送到已经等待的状态。

有人可以帮我解释一下我上述实施过程中可能存在的任何潜在问题吗?

提前感谢任何建议。

3 个答案:

答案 0 :(得分:2)

你的错误是你在调用pthread_cond_wait()之后没有解锁条件变量使用的互斥锁。

例如pthread_cond_wait()在线程被阻塞时在内部解锁互斥锁,但是当它被唤醒时它会重新获取锁,你需要明确地释放它。

有关cond的更多详细信息,请参阅本教程。变量:https://computing.llnl.gov/tutorials/pthreads/#ConditionVariables

答案 1 :(得分:1)

我遇到过类似的问题。在我的情况下,有时信号是在被阻塞的线程等待之前发送的。在这种情况下的行为是两个线程都“卡住”。 我们通过添加一个标志来通过发送信号来解决它。

答案 2 :(得分:0)

解决方案 - 请参阅以下说明
在信令调用pthread_cond_signal()之前放置pthread_mutex_unlock()而不是在它之后应该解决问题

...
pthread_mutex_lock(&mutex1);
predicate1 = false;
pthread_mutex_unlock(&mutex1);
pthread_cond_signal(&condition1);
...

在函数ThreadFunc2中,类似于线程1

...
pthread_mutex_lock(&mutex2);
predicate2 = true;
pthread_mutex_unlock(&mutex2);
pthread_cond_signal(&condition2);
...
函数ThreadFunc1中的

解释在你的程序中,线程2进入信令调用

pthread_cond_signal(&condition1); //  thread 2 with mutex1 locked

将mutex1锁定。线程1只能离开阻止

pthread_cond_wait(&mutex1);       //  thread 1 leaves only after mutex1 unlocked

调用自身锁定mutex1,这是此函数调用的保证行为 - 这意味着它应该被所有其他线程解锁才能继续。如果你有一个pthread_cond_signal()的实现阻塞,直到接收信号的线程继续,那么当它进入调用并锁定相应的互斥锁时会产生死锁。这也可以解释为什么一个环境可以简单地工作而另一个环境不能正常工作:例如,当您的嵌入式环境执行时,桌面环境没有对pthread_cond_signal()进行阻塞调用。