我一直在尝试解决某些脚本的执行导致死锁,将所有后续请求置于不确定状态,使用99.9%的CPU,并最终有效地崩溃服务器的问题。
以下是其中一个请求的示例堆栈跟踪(已永久等待):
Thread Stack Trace
Trace Time: 21:00:44.463 06-Jun-2012
Request ID: 6131
Script Name: http://www.example.com/allreviews.cfm
Started: 21:00:21.225 06-Jun-2012
Exec Time: 23238ms
Memory Used: (24%)230,667KB
Memory Free: 701,428KB
Thread ID: 0x191e (6430)
Thread Name: jrpp-494
Priority: 5
Hashcode: 1081611879
State: WAITING
"jrpp-494" prio=5 in Object.wait()
java.lang.Object.wait(Object.java:???)[Native Method]
- waiting on <0x9253305> (a coldfusion.util.AbstractCache$Lock)
java.lang.Object.wait(Object.java:485)
coldfusion.util.AbstractCache.fetch(AbstractCache.java:46)
coldfusion.util.SoftCache.get_statsOff(SoftCache.java:133)
coldfusion.util.SoftCache.get(SoftCache.java:81)
coldfusion.runtime.TemplateClassLoader.findClass(TemplateClassLoader.java:609)
coldfusion.runtime.RuntimeServiceImpl.getFile(RuntimeServiceImpl.java:785)
coldfusion.runtime.RuntimeServiceImpl.resolveTemplatePath(RuntimeServiceImpl.java:766)
coldfusion.tagext.lang.CustomTag.setName(CustomTag.java:21)
cfApplication2ecfm456206189._factor0(/srv/www/htdocs/www.example.com/www/Application.cfm:28)
cfApplication2ecfm456206189.runPage(/srv/www/htdocs/www.example.com/www/Application.cfm:1)
coldfusion.runtime.CfJspPage.invoke(CfJspPage.java:231)
coldfusion.tagext.lang.IncludeTag.doStartTag(IncludeTag.java:416)
coldfusion.filter.CfincludeFilter.invoke(CfincludeFilter.java:65)
coldfusion.filter.CfincludeFilter.include(CfincludeFilter.java:33)
coldfusion.filter.ApplicationFilter.invoke(ApplicationFilter.java:279)
coldfusion.filter.RequestMonitorFilter.invoke(RequestMonitorFilter.java:48)
coldfusion.filter.MonitoringFilter.invoke(MonitoringFilter.java:40)
coldfusion.filter.PathFilter.invoke(PathFilter.java:94)
coldfusion.filter.ExceptionFilter.invoke(ExceptionFilter.java:70)
coldfusion.filter.ClientScopePersistenceFilter.invoke(ClientScopePersistenceFilter.java:28)
coldfusion.filter.BrowserFilter.invoke(BrowserFilter.java:38)
coldfusion.filter.NoCacheFilter.invoke(NoCacheFilter.java:46)
coldfusion.filter.GlobalsFilter.invoke(GlobalsFilter.java:38)
coldfusion.filter.DatasourceFilter.invoke(DatasourceFilter.java:22)
coldfusion.filter.CachingFilter.invoke(CachingFilter.java:62)
coldfusion.CfmServlet.service(CfmServlet.java:200)
coldfusion.bootstrap.BootstrapServlet.service(BootstrapServlet.java:89)
jrun.servlet.FilterChain.doFilter(FilterChain.java:86)
com.intergral.fusionreactor.filter.FusionReactorCoreFilter.doHttpServletRequest(FusionReactorCoreFilter.java:503)
com.intergral.fusionreactor.filter.FusionReactorCoreFilter.doFusionRequest(FusionReactorCoreFilter.java:337)
com.intergral.fusionreactor.filter.FusionReactorCoreFilter.doFilter(FusionReactorCoreFilter.java:246)
com.intergral.fusionreactor.filter.FusionReactorFilter.doFilter(FusionReactorFilter.java:121)
jrun.servlet.FilterChain.doFilter(FilterChain.java:94)
coldfusion.monitor.event.MonitoringServletFilter.doFilter(MonitoringServletFilter.java:42)
coldfusion.bootstrap.BootstrapFilter.doFilter(BootstrapFilter.java:46)
jrun.servlet.FilterChain.doFilter(FilterChain.java:94)
jrun.servlet.FilterChain.service(FilterChain.java:101)
jrun.servlet.ServletInvoker.invoke(ServletInvoker.java:106)
jrun.servlet.JRunInvokerChain.invokeNext(JRunInvokerChain.java:42)
jrun.servlet.JRunRequestDispatcher.invoke(JRunRequestDispatcher.java:286)
jrun.servlet.ServletEngineService.dispatch(ServletEngineService.java:543)
jrun.servlet.jrpp.JRunProxyService.invokeRunnable(JRunProxyService.java:203)
jrunx.scheduler.ThreadPool$DownstreamMetrics.invokeRunnable(ThreadPool.java:320)
jrunx.scheduler.ThreadPool$ThreadThrottle.invokeRunnable(ThreadPool.java:428)
jrunx.scheduler.ThreadPool$UpstreamMetrics.invokeRunnable(ThreadPool.java:266)
jrunx.scheduler.WorkerThread.run(WorkerThread.java:66)
如果您有兴趣,可以在顶部看到full stack trace我称之为“锁定脚本”的所有其他人等等。
当我第一次遇到这个问题时,我没有堆栈跟踪。我发布了问题“When ColdFusion is maxing out the CPU, how do I find out what it's chewing/choking on?”。我收到了许多有用的回复,通过查看stack traces我能够确定它是一遍又一次导致此死锁问题的三个脚本相同。
在每种情况下,“锁定脚本”中的第一行都显示为:
coldfusion.compiler.ClassReader.skipFully(ClassReader.java:79)
并且所有其他请求被阻塞在它们各自的堆栈跟踪中有以下行:
- waiting on <0x9253305> (a coldfusion.util.AbstractCache$Lock)
困扰我的一件事是why my request timeout was not being respected;这些脚本会永远挂起,永远不会死。 WTF,对吧?所以我必须自己做。那么当我杀死'锁定脚本'时,其他人就会被释放出来。此时,如果它们低于请求超时,则它们完成处理,如果它们超过它(通常是它们的大多数),那么它们只是进行超时。但是它们不会自行超时,并且请求只会堆积起来,直到使用活动线程并且线程队列已满并且一切都会消失。
每次请求手动杀死这些都显然不是解决方案,所以,正如我的妻子总是在提醒我,“调试,调试,调试”。使用条件<cfabort>
我逐步完成,发现它一直在通过Application.cfm,通过我的header.cfm,直到问题脚本的<cfinclude>
。如果我将<cfabort>
放在问题脚本中(即使在最顶端),也不会中止,并且会发生死锁问题。如果我把它放在include之前,请求将中止,并且可以避免死锁问题。奇异。
这两个地方之间没有代码,对吗?就在包含之前和包含内部应该在功能上等同,不是吗?可能不是,因为显然某事正在进行中。
我没有使用任何<cflock>
标签。正在发生的锁定似乎发生在模板缓存级别。无论是否在管理中检查“可信缓存”,“请求中的缓存模板”或“组件缓存”选项(以任何已检查/未检查的组合),都会观察到相同的行为。我已清除模板缓存和组件缓存不止一次。我一遍又一遍地重启CF服务器......一切都无济于事。
在疑难解答期间,我阅读了此article describing a similar issue with a compiler cache lock in CF8(8.0.1)以及应用补丁修复补丁的说明。但那不是CF9 ......显然我不能应用他们的补丁。
怎么办?还有其他人遇到过这个问题吗? ......有解决方案吗?
答案 0 :(得分:2)
事实证明,有时类文件已损坏,需要重新生成。当您遇到此问题时,它将如上所述显示,在尝试加载损坏的类文件时出现死锁。重新生成类文件的步骤很简单,如下所示:
转到ColdFusion管理员&gt;服务器设置&gt;缓存
取消选中以下选项:
[]保存类文件
选择此选项后,ColdFusion生成的类文件将保存到磁盘,以便在服务器重新启动后重复使用。 Adobe建议将其用于生产系统。在开发过程中,Adobe建议您不要选择此选项。
单击[提交更改]按钮
重新启动ColdFusion服务器
转到ColdFusion管理员&gt;服务器设置&gt;缓存
检查以下选项:
[x]保存类文件
选择此选项后,ColdFusion生成的类文件将保存到磁盘,以便在服务器重新启动后重复使用。 Adobe建议将其用于生产系统。在开发过程中,Adobe建议您不要选择此选项。
单击[提交更改]按钮
你做完了!这个问题完全消失了,所有的一切都应该如此。 ; - )
为什么以及如何破坏类文件?我不知道。也许这可能是另一个问题的主题。我所知道的是,这解决了这个问题。我通常会犹豫是否接受我自己的答案作为权威,因此,如果其他人对此问题及其解决方案有更好的解释,请随时发布。
答案 1 :(得分:0)
作为一种解决方法,您可以尝试通过将“最大缓存模板数”设置为0来完全禁用模板缓存。不适合生产..但可能比崩溃更好..