解决COM +应用程序死锁问题

时间:2010-03-03 20:45:53

标签: windbg deadlock com+

我正在尝试对间歇性死锁的COM +应用程序进行故障排除。它最后一次锁定,我能够获取dllhost进程的usermode转储并使用WinDbg进行分析。在检查了所有线程和锁之后,这一切都归结为该线程拥有的一个关键部分:

ChildEBP RetAddr  Args to Child              
0deefd00 7c822114 77e6bb08 000004d4 00000000 ntdll!KiFastSystemCallRet
0deefd04 77e6bb08 000004d4 00000000 0deefd48 ntdll!ZwWaitForSingleObject+0xc
0deefd74 77e6ba72 000004d4 00002710 00000000 kernel32!WaitForSingleObjectEx+0xac
0deefd88 75bb22b9 000004d4 00002710 00000000 kernel32!WaitForSingleObject+0x12
0deeffb8 77e660b9 000a5cc0 00000000 00000000 comsvcs!PingThread+0xf6
0deeffec 00000000 75bb21f1 000a5cc0 00000000 kernel32!BaseThreadStart+0x34

它正在等待的对象是一个事件:

0:016> !handle 4d4 f
Handle 000004d4
  Type          Event
  Attributes    0
  GrantedAccess 0x1f0003:
         Delete,ReadControl,WriteDac,WriteOwner,Synch
         QueryState,ModifyState
  HandleCount   2
  PointerCount  4
  Name          <none>
  No object specific information available

据我所知,事件永远不会发出信号,导致线程挂起并在进程中保留其他几个线程。有没有人对下一步找出正在发生的事情有任何建议?

现在,看到该方法被称为PingThread,是否有可能它正在尝试ping已经死锁的进程中的另一个线程?

更新
这实际上是Oracle 10.2.0.1客户端中的一个错误。虽然,我仍然对如何在没有发现Oracle错误数据库中的错误的情况下解决这个问题的想法感兴趣。

2 个答案:

答案 0 :(得分:0)

SIEExtPub可以帮助您找出COM中的锁

以下是关于此

article

如果您在使用此扩展程序时遇到任何问题,请回发

答案 1 :(得分:0)

您可以使用!locks尝试自动分析死锁,然后转储线程~* kb的调用堆栈,并检查哪些线程正在等待关键部分或事件对象。

此处有一个示例用法:http://www.dumpanalysis.org/blog/index.php/2007/07/28/crash-dump-analysis-patterns-part-9c/

加上该人的网站有很多使用WinDbg用于其他类型死锁的示例,包括托管代码:http://www.dumpanalysis.org/只需在页面上搜索“死锁”,希望这会有所帮助。