pthread_mutex_lock阻塞但__lock = 0

时间:2014-03-10 09:07:51

标签: c++ c multithreading mutex

我正在编写一个多线程程序,并遇到死锁。

其中一个线程块正在休眠(cond_wait)

所以我输入了ctrl + c进入gdb终端

(gdb) info thread
  5 Thread 0x1c6ff4a0 (LWP 723)  __pthread_cond_wait (cond=0x420c50, mutex=0x420c34)
at pthread_cond_wait.c:156
  3 Thread 0x1bcf34a0 (LWP 721)  __pthread_cond_wait (cond=0x41a530, mutex=0x41a514)
at pthread_cond_wait.c:156
* 1 Thread 0x1b2c9720 (LWP 716)  __lll_lock_wait (futex=0x1be08240, private=0)
at ../nptl/sysdeps/unix/sysv/linux/lowlevellock.c:46
(gdb) bt
#0  __lll_lock_wait (futex=0x1be08240, private=0)
at ../nptl/sysdeps/unix/sysv/linux/lowlevellock.c:46
#1  0x1afa1540 in __pthread_mutex_lock (mutex=0x1be08240) at pthread_mutex_lock.c:61
#2  0x1abb7984 in readerWait (FrameInfo=0x1be08240, sem=0x1aad4000)
at CamIPCSource.cpp:282
......

我可以看到这个帖子在CamIPCSource.cpp被阻止了:282

但是当我换成第2帧并打印互斥锁时

(gdb) frame 2
#2  0x1abb7984 in readerWait (FrameInfo=0x1be08240, sem=0x1aad4000)
at CamIPCSource.cpp:282
(gdb) p FrameInfo->m_Reader
$1 = {__data = {__lock = 0, __count = 0, __owner = 0, __kind = 0, __nusers = 0, {
  __spins = 0, __list = {__next = 0x0}}}, __size = '\000' <repeats 23 times>,
__align = 0}

这不奇怪吗?阻止非块互斥?

当我让gdb继续时,程序成功获得锁定

我的问题:我还能做些什么来了解线程阻塞非块互斥的原因?

环境:由mipsel-linux-gnu-g ++ - 4.4编译,在mips上运行(libpthread-2.11.3)

这里是代码片段(CamIPCSource.cpp),其中线程阻塞:

277 int readerWait(frame_info_t* FrameInfo, sem_t* sem) {
278     int ret;
279
280     if (FrameInfo == NULL || sem == NULL)   return -1;
281
282     pthread_mutex_lock(&FrameInfo->m_Reader);
283     /*while ((ret = pthread_mutex_trylock(&FrameInfo->m_Reader)) != 0) {
284         if (ret == EBUSY)
285             fprintf(stderr, "-");
286         else {
287             _err("pthread_mutex_trylock:(%s)\n", strerror(ret));
288             return -1;
289         }                                                                                              
290     }*/
291                                                                                            292     FrameInfo->ReaderCount++;
293     if (FrameInfo->ReaderCount == 1) {
294         if (sem_wait(sem) != 0) {
295             _err("sem_wait:(%s)\n", strerror(errno));
296             FrameInfo->ReaderCount--;
297             if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0);
298                 _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
299             return -1;
300         }
301      }
302     if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0)
303         _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
304
305     return 0;
306 }

顺便说一句,我试图用第283~290行的pthread_mutex_trylock替换pthread_mutex_lock

并且它偶尔会产生一些“ - ”输出:(

这是ReaderSignal函数(ReaderWait / ReaderSignal是访问此互斥锁的唯一两个函数)

339 int readerSignal(frame_info_t* FrameInfo, sem_t* sem) {
340     int ret;
341
342     if (FrameInfo == NULL || sem == NULL)   return -1; 
343
344     pthread_mutex_lock(&FrameInfo->m_Reader);
345     /*while ((ret = pthread_mutex_trylock(&FrameInfo->m_Reader)) != 0) {
346         if (ret == EBUSY)
347             fprintf(stderr, "-");
348         else {
349             _err("pthread_mutex_trylock:(%s)\n", strerror(ret));
350             return -1;
351         }
352     }*/
353     FrameInfo->ReaderCount--;
354     if (FrameInfo->ReaderCount == 0) {
355         if (sem_post(sem) != 0) {
356             _err("sem_post:(%s)\n", strerror(errno));
357             FrameInfo->ReaderCount++;
358             if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0)
359                 _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
360             return -1;
361         }
362
363     }
364     if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0)
365         _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
366
367     return 0;
368 }

1 个答案:

答案 0 :(得分:1)

使用GDB调试多线程程序通常很困难。最好使用旨在处理多线程问题的工具。我强烈推荐看看Helgrind:

http://valgrind.org/docs/manual/hg-manual.html

从该页面开始:“Helgrind是一个Valgrind工具,用于检测使用POSIX pthreads线程原语的C,C ++和Fortran程序中的同步错误。”

它将提供有关潜在竞争条件,死锁等的信息。真的非常棒。它不止一次救了我。

祝你好运!