我正在开发一个基于PostgreSQL 9,hibernate 4.3.5.Final,c3p0,Tomcat 7和JDK 7的应用程序。
这是c3p0配置:
hibernate.c3p0.min_size=5
hibernate.c3p0.max_size=20
hibernate.c3p0.timeout=1800
hibernate.c3p0.max_statements=50
使用几个小时后,应用程序挂起。所有屏幕都被冻结,因为似乎没有打开数据库的新事务。
我在tomcat 7进程上执行了kill -3(部署了一个应用程序),以查看所有线程的锁定位置。这是输出的一部分:
"ajp-bio-8127-exec-274" daemon prio=10 tid=0x0000000001365000 nid=0x257b in Object.wait() [0x0000000045242000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
at com.mchange.v2.resourcepool.BasicResourcePool.awaitAvailable(BasicResourcePool.java:1414)
at com.mchange.v2.resourcepool.BasicResourcePool.prelimCheckoutResource(BasicResourcePool.java:606)
- locked <0x000000078567cb70> (a com.mchange.v2.resourcepool.BasicResourcePool)
at com.mchange.v2.resourcepool.BasicResourcePool.checkoutResource(BasicResourcePool.java:526)
at com.mchange.v2.c3p0.impl.C3P0PooledConnectionPool.checkoutAndMarkConnectionInUse(C3P0PooledConnectio
所有http请求进程都是一样的。因此,所有请求都无限期地等待池中的可用连接。
我们看了一下postgres,看到有20个连接打开了(20个是最大池数):
foobar=# select datname, usename, client_port, query from pg_stat_activity where usename='foobar';
datname | usename | client_port | query
---------+---------+-------------+----------
foobar | foobar | 52992 | ROLLBACK
foobar | foobar | 52993 | ROLLBACK
foobar | foobar | 52991 | ROLLBACK
foobar | foobar | 52994 | ROLLBACK
foobar | foobar | 52995 | ROLLBACK
foobar | foobar | 36398 | ROLLBACK
foobar | foobar | 36399 | ROLLBACK
foobar | foobar | 36400 | ROLLBACK
foobar | foobar | 51766 | ROLLBACK
foobar | foobar | 56689 | ROLLBACK
foobar | foobar | 56690 | ROLLBACK
foobar | foobar | 39582 | ROLLBACK
foobar | foobar | 39581 | ROLLBACK
foobar | foobar | 39583 | ROLLBACK
foobar | foobar | 39590 | ROLLBACK
foobar | foobar | 39592 | ROLLBACK
foobar | foobar | 39591 | ROLLBACK
foobar | foobar | 41799 | ROLLBACK
foobar | foobar | 36105 | ROLLBACK
foobar | foobar | 36103 | ROLLBACK
(20 rows)
因此,我们将池日志配置为DEBUG,我们可以看到像这样的语句:
2014/07/09 05:24:40 DEBUG (BasicResourcePool.java:1747) trace trace com.mchange.v2.resourcepool.BasicResourcePool@12c39c9e [managed: 19, unused: 4, excluded: 0] (e.g. com.mchange.v2.c3p0.impl.NewPooledConnection@4fc04747)
他们表明托管连接数缓慢增长直到被管理:20和usused:0这个最终状态保持稳定,应用程序被冻结,因为所有线程都期望从池中获得连接。
它是一个Web应用程序,我们在请求模式中使用会话,因此在处理每个请求后(在finally语句中)正确关闭连接。在应用程序日志中没有像ERROR或WARN这样的东西。
我怎么知道我做错了什么?
答案 0 :(得分:1)
很明显,这些查询在没有被释放的情况下被阻止。可能是您遇到了一些异常或者您没有看到的异常,因为查询被标记为ROLLBACK
,并且由于某种原因,线程正在等待查询完成或者某种类型。没有看到代码很难准确说出来。
你可以做的是等待这种情况再次发生,然后获得完整的线程转储。这应该为您提供每个线程挂起位置的完整详细信息,以便您可以看到20个连接正在等待的内容。
您可以使用jstack来加载JDK。
您还可以在Tomcat上启用JMX并使用jconsole或jvisualvm连接到它,以实时查看线程正在做什么。
答案 1 :(得分:0)
您的应用程序似乎耗尽了可用的池连接。仅当抛出异常时,事务才会标记为回滚。如果您看不到任何异常,可能是因为您没有正确处理它们,例如记录任何具有ERROR阈值的异常。
您还需要检查数据库日志,也许您找到导致所有这些事务回滚的原因。