我正在编写一个多线程程序,并遇到死锁。
其中一个线程块正在休眠(cond_wait)
所以我输入了ctrl + c进入gdb终端
(gdb) info thread
5 Thread 0x1c6ff4a0 (LWP 723) __pthread_cond_wait (cond=0x420c50, mutex=0x420c34)
at pthread_cond_wait.c:156
3 Thread 0x1bcf34a0 (LWP 721) __pthread_cond_wait (cond=0x41a530, mutex=0x41a514)
at pthread_cond_wait.c:156
* 1 Thread 0x1b2c9720 (LWP 716) __lll_lock_wait (futex=0x1be08240, private=0)
at ../nptl/sysdeps/unix/sysv/linux/lowlevellock.c:46
(gdb) bt
#0 __lll_lock_wait (futex=0x1be08240, private=0)
at ../nptl/sysdeps/unix/sysv/linux/lowlevellock.c:46
#1 0x1afa1540 in __pthread_mutex_lock (mutex=0x1be08240) at pthread_mutex_lock.c:61
#2 0x1abb7984 in readerWait (FrameInfo=0x1be08240, sem=0x1aad4000)
at CamIPCSource.cpp:282
......
我可以看到这个帖子在CamIPCSource.cpp被阻止了:282
但是当我换成第2帧并打印互斥锁时
(gdb) frame 2
#2 0x1abb7984 in readerWait (FrameInfo=0x1be08240, sem=0x1aad4000)
at CamIPCSource.cpp:282
(gdb) p FrameInfo->m_Reader
$1 = {__data = {__lock = 0, __count = 0, __owner = 0, __kind = 0, __nusers = 0, {
__spins = 0, __list = {__next = 0x0}}}, __size = '\000' <repeats 23 times>,
__align = 0}
这不奇怪吗?阻止非块互斥?
当我让gdb继续时,程序成功获得锁定
环境:由mipsel-linux-gnu-g ++ - 4.4编译,在mips上运行(libpthread-2.11.3)
这里是代码片段(CamIPCSource.cpp),其中线程阻塞:
277 int readerWait(frame_info_t* FrameInfo, sem_t* sem) {
278 int ret;
279
280 if (FrameInfo == NULL || sem == NULL) return -1;
281
282 pthread_mutex_lock(&FrameInfo->m_Reader);
283 /*while ((ret = pthread_mutex_trylock(&FrameInfo->m_Reader)) != 0) {
284 if (ret == EBUSY)
285 fprintf(stderr, "-");
286 else {
287 _err("pthread_mutex_trylock:(%s)\n", strerror(ret));
288 return -1;
289 }
290 }*/
291 292 FrameInfo->ReaderCount++;
293 if (FrameInfo->ReaderCount == 1) {
294 if (sem_wait(sem) != 0) {
295 _err("sem_wait:(%s)\n", strerror(errno));
296 FrameInfo->ReaderCount--;
297 if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0);
298 _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
299 return -1;
300 }
301 }
302 if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0)
303 _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
304
305 return 0;
306 }
顺便说一句,我试图用第283~290行的pthread_mutex_trylock替换pthread_mutex_lock
并且它偶尔会产生一些“ - ”输出:(
这是ReaderSignal函数(ReaderWait / ReaderSignal是访问此互斥锁的唯一两个函数)
339 int readerSignal(frame_info_t* FrameInfo, sem_t* sem) {
340 int ret;
341
342 if (FrameInfo == NULL || sem == NULL) return -1;
343
344 pthread_mutex_lock(&FrameInfo->m_Reader);
345 /*while ((ret = pthread_mutex_trylock(&FrameInfo->m_Reader)) != 0) {
346 if (ret == EBUSY)
347 fprintf(stderr, "-");
348 else {
349 _err("pthread_mutex_trylock:(%s)\n", strerror(ret));
350 return -1;
351 }
352 }*/
353 FrameInfo->ReaderCount--;
354 if (FrameInfo->ReaderCount == 0) {
355 if (sem_post(sem) != 0) {
356 _err("sem_post:(%s)\n", strerror(errno));
357 FrameInfo->ReaderCount++;
358 if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0)
359 _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
360 return -1;
361 }
362
363 }
364 if ((ret = pthread_mutex_unlock(&FrameInfo->m_Reader)) != 0)
365 _err("pthread_mutex_unlock:(%s)\n", strerror(ret));
366
367 return 0;
368 }
答案 0 :(得分:1)
使用GDB调试多线程程序通常很困难。最好使用旨在处理多线程问题的工具。我强烈推荐看看Helgrind:
http://valgrind.org/docs/manual/hg-manual.html
从该页面开始:“Helgrind是一个Valgrind工具,用于检测使用POSIX pthreads线程原语的C,C ++和Fortran程序中的同步错误。”
它将提供有关潜在竞争条件,死锁等的信息。真的非常棒。它不止一次救了我。
祝你好运!