我们目前正在对我们的BI基础架构进行负载测试。我们正在针对单个pentaho节点(双服务器平台)测试 10个并发用户。
每个用户的测试场景是:
如您所见,第3步和第4步都在循环中。
运行此测试15分钟后, BI平台变得非常无响应。加载主页大约需要三分钟。加载后,尝试按下浏览文件/创建nnw等按钮不会导致任何视图更改。
我们使用了一个java profiler工具来解决应用程序内部发生的事情,并发现 200个http线程(请参阅线程)附件。其中大约95%的人大部分时间被阻止等待资源(见阻止)。 这是正常的吗?我担心管理等待资源的这么多线程对处理器来说可能是一个很大的开销。我们检查了BI平台的代码(参见代码),确实存在资源锁定,根据此方法中等待的线程数判断似乎经常重新计算。
主题(http://postimg.org/image/4c2yug17f/full/) 被阻止(http://postimg.org/image/gm32nbd29/) 代码(http://postimg.org/image/6p5vt1b6r/)
附加在执行测试时拍摄的cpu和ram使用图。 CPU(http://postimg.org/image/tbxubog6b/full/): RAM(http://postimg.org/image/jecpimes9/full/):
是否有人遇到类似问题?我很高兴听到有关Pentaho BI Server的负载测试/负载优化方面的其他经验。
答案 0 :(得分:1)
经过一周多的测试后,Pentaho方面的问题与错误的线程同步相关,导致死锁。
我们已经能够与Pentaho联系,他们确认这是他们身边的一个错误(见jira:http://jira.pentaho.com/browse/BISERVER-12642)。这应该在Pentaho 5.4的服务包中修复。