我们有一个应用程序在几千台相同的机器上运行。相同的OS,相同的硬件,相同的应用程序安装在非常罕见的情况下,机器锁定。 Alt选项卡,ctrl-alt-del,应用程序都没有响应。检查我们的应用程序日志文件后,会将一系列空字符写入结尾,作为崩溃前的最后一个数据。
我希望用这个事实来调试锁定。我的猜测是,写入的空字符数等于我需要为日志语句分配的空间,但内容实际上从未写入磁盘。我也猜测发生了磁盘IO问题,阻止了写入,当然还有OS锁定。我无法证实这一点。所以我想我的问题是 - 你有没有见过这样的情况,它是如何发生的,你怎么去排除故障呢?
答案 0 :(得分:2)
我见过这种事情,我认为你正朝着正确的方向前进。
当发生这种情况时,我假设您能够精确定位硬件?失败后,我建议运行memtest(http://www.memtest.org/)。
我已经看过电源,坏磁盘控制器等等。你可能会疯狂地试图追踪它们。
看起来你正在以正确的方式解决这个问题 - 看看你是否能找到一种方法来加快问题的发生速度,当它发生时运行memtest,运行chkdsk / R(检查事件日志中的控制器错误)此)
你是否有机会连接内核调试器?
是否有机会生成%SystemRoot%\ memory.dmp?
答案 1 :(得分:2)
NTFS不会记录数据(仅限元数据),因此可能会发生这种情况。原因只是在崩溃/挂起时,提交了元数据(文件大小,数据块分配),而不是数据(数据块内容)。不幸的是,这是NTFS的正常行为,并且不会让您深入了解导致挂起的问题。
所以答案是:“正确”时间崩溃会导致这种情况。
BTW:FAT / FAT32当然也会发生同样的事情。