任何推荐的Java分析教程?

时间:2010-03-11 03:15:31

标签: java performance profiling

是否有任何推荐的Java应用程序分析教程?

我现在正在使用JProfilerEclipse Test & Performance Tools Platform(TPTP)进行分析。然而,尽管配备了精彩的武器,作为Java新概要的新手,我仍然缺少指出瓶颈的一般理论和技巧。

5 个答案:

答案 0 :(得分:39)

剖析是一门有不止一种思想的学科。

更受欢迎的是您通过测量继续进行。也就是说,您尝试查看每个函数需要多长时间和/或调用它的次数。显然,如果一个函数花费很少的时间,那么加速它将获得很少的收益。但是如果需要花费很多时间,那么你必须做一些侦探工作来弄清楚功能的哪个部分对时间负责。不要指望函数时间加起来总时间,因为函数互相调用,而函数A可能需要花费很多时间的原因是它调用函数B也需要花费很多时间。

这种方法可以发现很多问题,但这取决于你是一个好侦探,能够清楚地思考不同的时间,如挂钟时间与CPU时间,以及自我时间与包容时间。例如,应用程序可能看起来很慢,但功能时间可能都报告为接近零。这可能是程序受I / O限制造成的。如果I / O是您期望的,那可能没什么问题,但它可能正在做一些您不知道的I / O,然后您又回到了侦探工作。

对于分析器的普遍期望是,如果你可以修复足够的东西来获得10%或20%的加速,那就非常好了,而且我从来没有听说过重复使用分析器的故事,以获得比这更多的加速。

另一种方法不是测量,而是捕获。它的基础是,在程序花费的时间比你想要的更长时间(在挂钟时间内),你想要知道它在做什么,主要是,并找到一种方法来阻止它并询问,或者对其状态进行快照并对其进行分析,以便完全了解它正在做什么,以及为什么它会在特定时间点进行。如果您多次执行此操作并且您看到它多次尝试执行的操作,那么您可以有效地优化该活动。不同之处在于你没有要求多少;你问的是什么为什么Here's another explanation.(请注意,拍摄这样快照的速度无关紧要,因为你不是在询问时间,而是在问这个节目在做什么以及为什么。)

对于Java,here is one low-tech but highly effective方法,或者您可以使用Eclipse中的“暂停”按钮。另一种方法是使用特定类型的分析器,一个对整个调用堆栈进行采样,在挂钟时间(不是CPU,除非你想对I / O无视),当你想要它进行采样时(例如,不是在等待用户输入时),并在代码行级别汇总,而不仅仅是功能级别和时间百分比,而不是绝对时间。为了获得时间的百分比,它应该告诉您,对于任何样本上出现的每行代码,包含该行的样本的百分比,因为如果您可以使该行消失,您将保存该百分比。 (你应该忽略它试图告诉你的其他事情,比如调用图,递归和自我时间。)很少有符合这个规范的分析器,但是一个是RotateRight/Zoom,但我不确定如果它适用于Java,可能还有其他。

在某些情况下,在实际缓慢的时候,可能很难在需要时获取堆栈样本。然后,由于您所追求的是百分比,您可以对代码执行任何操作,以便在不改变百分比的情况下更轻松地获取样本。一种方法是通过在100次迭代周围包裹一个临时循环来放大代码。另一种方法是在调试器下设置数据更改断点。这将导致代码被解释为比正常情况慢10-100倍。另一种方法是使用闹钟定时器在慢速期间关闭,并用它来抓取样本。

使用捕获技术,如果您反复使用它来查找和执行多个优化,您可以期望达到接近最佳的性能。在大型软件的情况下,瓶颈更多,这可能意味着重要因素。 Stack Overflow上的人报告了从7倍到60倍的因素。 Here is a detailed example of 43x.

捕获技术遇到的问题是很难弄清楚线程在等待的原因,例如等待事务在另一个处理器上完成时。 (测量有同样的问题。)在这些情况下,我使用一种费力的方法来合并带时间戳的日志。

答案 1 :(得分:9)

我正在使用Yourkit Java Profiler 11.0,它非常适合内存优化和监视CPU时间。 此外,yourkit网站还拥有良好的知识库和帮助主题。

答案 2 :(得分:4)

作为分析的新手,您应该首先寻找具有较长运行时间和/或在典型使用模式/瓶颈发生时多次调用的方法。

我不确定Eclipse与JProfiler的集成是如何工作的,因为我主要使用NetBeans。但是,在NetBeans中有一个“快照”视图,显示方法调用的层次结构,运行时总计高达100%。我寻找层次结构中占用总时间(相对)大部分的部分。从那里你必须考虑这些方法正在做什么,以及可能导致它们变慢的原因。

例如:我注意到一个被频繁调用的方法总是花费太多时间来完成,并且是一个严重的瓶颈。简而言之,事实证明代码正在使用.contains()方法检查项目是否存在于集合中,并且集合是链接列表。这是一个问题的原因是因为链接列表对于像.contains()这样的函数具有O(n)的时间复杂度。在这种情况下的修复非常简单,因为我能够用一个哈希集替换链接列表,哈希集在O(1)时间内更快地执行.contains()

答案 3 :(得分:2)

JProfiler附带了它的帮助手册。我发现这非常好。

答案 4 :(得分:1)

您可能会发现Java平台性能这本书很有趣。由Sun Microsystems出版。