在JTextPane中插入一些字符会导致性能问题和内存泄漏

时间:2013-05-16 02:18:56

标签: java swing unicode memory-leaks jtextpane

我的聊天客户端有一个JTextPane,其中插入了文本,最多可以达到每秒几行。它通常工作正常,即使是较长的时间(例如一小时),但有时它会变得非常慢,使用大量的CPU和内存,有时高达1GB并且几乎完全冻结。

我添加了“-Xrunhprof:heap = sites”参数来找出使用内存的内容以及我可以收集的内容,它与文本呈现有关,虽然我真的不知道这些东西,所以这是一个有根据的猜测。这是结果的一部分,在内存使用异常高时采用。我在每个条目下都包含了适当的跟踪。其他堆转储看起来略有不同,但它总是指向相同或类似的类(名称中包含Glyph的东西)。不确定如何正确解释这一点,以及它是否真的有助于解决这个问题。

         percent          live          alloc'ed  stack class
rank   self  accum     bytes objs     bytes  objs trace name
   1 16.33% 16.33%  11209120 350285  99416352 3106761 319103 java.awt.geom.Rectangle2D$Float

TRACE 319103:
java.awt.geom.RectangularShape.<init>(RectangularShape.java:56)
java.awt.geom.Rectangle2D.<init>(Rectangle2D.java:511)
java.awt.geom.Rectangle2D$Float.<init>(Rectangle2D.java:111)
sun.font.StandardGlyphVector$GlyphStrike.getGlyphOutlineBounds(StandardGlyphVector.java:1790)

   2 14.28% 30.61%   9799744 3958  52026864 49485 319095 float[]

TRACE 319095:
sun.font.StandardGlyphVector.getGlyphInfo(StandardGlyphVector.java:851)
sun.font.ExtendedTextSourceLabel.createCharinfo(ExtendedTextSourceLabel.java:583)
sun.font.ExtendedTextSourceLabel.getCharinfo(ExtendedTextSourceLabel.java:509)
sun.font.ExtendedTextSourceLabel.getLineBreakIndex(ExtendedTextSourceLabel.java:455)

   3  8.17% 38.77%   5604560 350285  49708176 3106761 319110 sun.font.DelegatingShape

TRACE 319110:
sun.font.DelegatingShape.<init>(DelegatingShape.java:43)
sun.font.StandardGlyphVector.getGlyphVisualBounds(StandardGlyphVector.java:586)
sun.font.StandardGlyphVector.getGlyphInfo(StandardGlyphVector.java:864)
sun.font.ExtendedTextSourceLabel.createCharinfo(ExtendedTextSourceLabel.java:583)

   4  7.96% 46.74%   5466576 9933  40683104 164341 319090 float[]

TRACE 319090:
sun.font.GlyphLayout$GVData.createGlyphVector(GlyphLayout.java:596)
sun.font.GlyphLayout.layout(GlyphLayout.java:476)
sun.font.ExtendedTextSourceLabel.createGV(ExtendedTextSourceLabel.java:325)
sun.font.ExtendedTextSourceLabel.getGV(ExtendedTextSourceLabel.java:311)

   5  4.07% 50.81%   2795304 9933  21434888 164341 319089 int[]

TRACE 319089:
sun.font.GlyphLayout$GVData.createGlyphVector(GlyphLayout.java:591)
sun.font.GlyphLayout.layout(GlyphLayout.java:476)
sun.font.ExtendedTextSourceLabel.createGV(ExtendedTextSourceLabel.java:325)
sun.font.ExtendedTextSourceLabel.getGV(ExtendedTextSourceLabel.java:311)

   6  3.71% 54.52%   2544072 106003 183421728 7642572 319087 java.awt.geom.Point2D$Float

TRACE 319087:
java.awt.geom.Point2D.<init>(Point2D.java:237)
java.awt.geom.Point2D$Float.<init>(Point2D.java:69)
sun.font.FileFontStrike.getGlyphMetrics(FileFontStrike.java:791)
sun.font.FileFontStrike.getGlyphMetrics(FileFontStrike.java:787)

   7  3.70% 58.22%   2539560 105815 182834016 7618084 319088 java.awt.geom.Point2D$Float

TRACE 319088:
java.awt.geom.Point2D.<init>(Point2D.java:237)
java.awt.geom.Point2D$Float.<init>(Point2D.java:69)
sun.font.FileFontStrike.getGlyphMetrics(FileFontStrike.java:809)
sun.font.FileFontStrike.getGlyphMetrics(FileFontStrike.java:787)

   8  2.20% 60.42%   1512888 6109  14728808 123309 319100 java.awt.Shape[]

TRACE 319100:
sun.font.StandardGlyphVector.getGlyphVisualBounds(StandardGlyphVector.java:580)
sun.font.StandardGlyphVector.getGlyphInfo(StandardGlyphVector.java:864)
sun.font.ExtendedTextSourceLabel.createCharinfo(ExtendedTextSourceLabel.java:583)
sun.font.ExtendedTextSourceLabel.getCharinfo(ExtendedTextSourceLabel.java:509)

   9  2.20% 62.62%   1507120 2151  49362432 73824 319503 float[]

TRACE 319503:
sun.font.StandardGlyphVector.getGlyphInfo(StandardGlyphVector.java:851)
sun.font.ExtendedTextSourceLabel.createCharinfo(ExtendedTextSourceLabel.java:583)
sun.font.ExtendedTextSourceLabel.getCharinfo(ExtendedTextSourceLabel.java:509)
sun.font.ExtendedTextSourceLabel.getCharX(ExtendedTextSourceLabel.java:353)

  10  2.09% 64.71%   1437120 44910  99416352 3106761 319111 java.awt.geom.Rectangle2D$Float

TRACE 319111:
java.awt.geom.RectangularShape.<init>(RectangularShape.java:56)
java.awt.geom.Rectangle2D.<init>(Rectangle2D.java:511)
java.awt.geom.Rectangle2D$Float.<init>(Rectangle2D.java:128)
java.awt.geom.Rectangle2D$Float.getBounds2D(Rectangle2D.java:251)

  11  1.84% 66.55%   1262456    6   1707160    18 307780 char[]

TRACE 307780:
javax.swing.text.GapContent.allocateArray(GapContent.java:94)
javax.swing.text.GapVector.resize(GapVector.java:214)
javax.swing.text.GapVector.shiftEnd(GapVector.java:229)
javax.swing.text.GapContent.shiftEnd(GapContent.java:345)

  12  1.16% 67.71%    794640 9933  13147280 164341 319092 sun.font.StandardGlyphVector

TRACE 319092:
    java.awt.font.GlyphVector.<init>(GlyphVector.java:109)
 sun.font.StandardGlyphVector.<init>(StandardGlyphVector.java:185)
    sun.font.GlyphLayout$GVData.createGlyphVector(GlyphLayout.java:607)
    sun.font.GlyphLayout.layout(GlyphLayout.java:476)

我还用JConsole监视程序并注意到,当它开始使用更多的资源时,聊天记录中有一些我无法识别的字符(例如表情符号,某种印度字符和某种泰语字符,被用作表情符号的一部分)。我尝试将自己的相同字符插入到JTextPane中,这本身花费的时间非常长,并且还使后续文本插入速度慢得多。

我创建了一个SSCCE,我可以用它来重现这个问题:

  • 插入明显破坏的字符后...
    • ..如果没有插入更多的换行符,它会在几百行之后变慢。
    • ..如果已经有几百行存在,那么在更改每次插入时添加到StyledDocument的Style时会慢很多。
    • ..它只会稍微慢一些(CPU使用率增加几个百分点),但逐渐使用越来越多的内存。

我想不添加换行符会将所有插入的文本视为一个实体,而更改已添加到StyledDocument的样式可能会以某种方式更新整个文档,尽管我不知道这一点,因为它实际上并没有改变已插入文字的风格。

现在这里是SSCCE(用jdk1.7.0_21测试),带有一个简单的命令输入:“test”添加了许多相同的行,“insert1”或“insert2”添加了一个减慢一切的字符,“样式“更改已添加到StyledDocument的样式与另一个样式之间的变化,”linebreak“在添加linesbreaks之间切换,而不是。其他输入只是直接添加到JTextPane。

import java.awt.BorderLayout;
import java.awt.Color;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.util.logging.Level;
import java.util.logging.Logger;
import javax.swing.*;
import javax.swing.text.*;

public class JTextPaneTest extends JFrame implements Runnable, ActionListener {

    JTextPane textPane;
    JTextField input;
    Style styleA;
    SimpleAttributeSet styleB;
    StyledDocument doc;
    boolean setStyleA = false;
    boolean linebreak = true;

    public JTextPaneTest() {
        SwingUtilities.invokeLater(this);
    }

    @Override
    public void run() {

        // Text Pane
        textPane = new JTextPane();
        doc = textPane.getStyledDocument();
        JScrollPane scrollPane = new JScrollPane(textPane);

        // Styles
        styleA = doc.addStyle("styleA", null);
        styleB = new SimpleAttributeSet();

        // Input
        input = new JTextField();
        input.addActionListener(this);

        // Add everything to the window
        this.getContentPane().add(scrollPane, BorderLayout.CENTER);
        getContentPane().add(input, BorderLayout.SOUTH);

        // Prepare and show window
        this.setDefaultCloseOperation(EXIT_ON_CLOSE);
        pack();
        this.setSize(400, 300);
        setVisible(true);
    }

    public static void main(String[] args) {
        new JTextPaneTest();
    }

    void insert(final String text) {
        SwingUtilities.invokeLater(new Runnable() {
            @Override
            public void run() {
                try {
                    if (setStyleA) {
                        // Changing styleA, which is added to the StyledDocument
                        // seems to make the problem worse
                        StyleConstants.setForeground(styleA, Color.blue);
                    }
                    else {
                        StyleConstants.setForeground(styleB, Color.blue);
                    }
                    // Not adding a linebreak seems to make the problem worse
                    String addLinebreak = "";
                    if (linebreak) {
                        addLinebreak = "\n";
                    }
                    doc.insertString(doc.getLength(), text+addLinebreak, null);
                } catch (BadLocationException ex) {
                    Logger.getLogger(JTextPaneTest.class.getName()).log(Level.SEVERE, null, ex);
                }

            }
        });
    }

    @Override
    public void actionPerformed(ActionEvent e) {
        String text = input.getText();

        if (text.equals("test")) {
            new Thread(new Runnable() {
                @Override
                public void run() {
                    // Insert some text to kind of simulate chat messages coming in
                    for (int i = 0; i < 500; i++) {
                        try {
                            Thread.sleep(250);
                        } catch (InterruptedException ex) {
                            Logger.getLogger(JTextPaneTest.class.getName()).log(Level.SEVERE, null, ex);
                        }
                        insert(i + " Test text to sort of simulate a chat message");
                    }
                }
            }).start();
        }
        // Insert text that seems to break something
        // Example 1:
        else if (text.equals("insert1")) {
            insert("\uD83D\uDE3A");
        }
        // Example 2:
        else if (text.equals("insert2")) {
            insert("\u0E07");
        }
        // Toggle changing styleA or styleB
        else if (text.equals("style")) {
            if (this.setStyleA) {
                setStyleA = false;
                insert("Style: B");
            }
            else {
                setStyleA = true;
                insert("Style: A");
            }
        }
        // Toggle printing a linebreak after each insert
        else if (text.equals("linebreak")) {
            if (this.linebreak) {
                linebreak = false;
                insert("Linebreak: OFF");
            }
            else {
                linebreak = true;
                insert("Linebreak: ON");
            }
        }
        // Output entered text
        else {
            insert(input.getText());
            input.setText("");
        }
    } 
}

现在的问题是,那里发生了什么。这是一个已知的bug吗?难道我做错了什么?添加单个字符会产生这种效果似乎很奇怪。即使渲染成本稍高,也不应该造成太多麻烦。

如果是Java错误,我可以做什么作为解决方法?也许以某种方式过滤受影响的角色?但我甚至都不知道那是哪一个。如果我做错了什么,那是什么?也许我必须在插入之前以某种方式准备文本?改变它的编码?也许这是我需要改变的非常基本和简单的东西?请帮忙。 :)

更新: 下图显示插入5000行文本(大约需要20分钟)时,在插入其中一个麻烦的字符后,在左边没有做任何特殊操作时会发生什么。我在JConsole完成后请求了垃圾收集,左边的垃圾收集大约下降到10 MB,而右边的垃圾收集只下降到大约45 MB,这要多得多,考虑到唯一的区别是一个插入的字符。之后的下降只是JConsole断开连接。您还可以看到CPU使用率在右侧高出约0.5个百分点。我重复了几次这个测试,结果总是一样的。这没有使用问题更严重的换行/样式内容。

Memory leak

1 个答案:

答案 0 :(得分:2)

这就是我的所作所为:

  1. 运行SSCCE程序
  2. 附加JVisualVM并开始内存探查器
  3. 让程序初始化并稳定堆;强制GC并从分析器中获取快照。
  4. 在程序中输入“test”并让它完成添加新内容
  5. 从JVisualVM强制GC并从分析器
  6. 获取快照
  7. 在程序中输入“insert1”和“insert2”以生成问题字符
  8. 在程序中输入“test”以生成其他正常内容并完成
  9. 从JVisualVM强制GC并从分析器获取快照,同时让JVisualVM生成堆转储
  10. 我看到你在问题中提到的内容,但想补充一下:

    • 特殊字符DO使用与普通示例文本不同的渲染路径。例如,比较快照(3)和(5)之间的差异,仅显示sun.font.*包中的一个类。快照(5)和(8)之间的差异显示现在使用额外的~40个类。其中包括您提到的课程:sun.font.StandardGlyphVectorsun.font.ExtendedTextSourceLabelsun.font.StandardTextSourcesun.font.DelegatingShape

    • 在上面提到的类中,大多数在我的分析运行中有~850个活动对象。但sun.font.DelegatingShape是一个约有20,000个活动对象的异常值。

    • 我使用JVisualVM来探索最终的堆转储并专注于DelegatingShape类。这些对象持有对不同java.awt.geom.Rectangle2D$Float个对象的引用。这两个都由Shape[]内的StandardGlyphVector数组保持活跃,并与ExtendedTextSourceLabel共享。每个数组包含~49个非空元素。

    • 查看源代码,这些数组由软引用保存,作为各个字形的可视边界框的缓存类型(请参阅:StandardGlyphVector.getGlyphVisualBounds())。好消息是只能通过Soft References 访问的对象可以进行垃圾收集,并且不会直接构成内存泄漏。只要可以,VM就会将它们留在内存中(增加堆)。如果通过其他方式强烈保持对象,则永远不会收集它们;我目前没有注意到任何明显的强烈推荐。

    但是为什么这么多的ExtendedTextSourceLabels呢?总而言之,JTextPane是在javax.swing.text.BoxView之上实现的,ParagraphView通过您的文档插入~1002行后,包含~4004 TextLayoutStrategy个子对象。每个视图都包含自己的ExtendedTextSourceLabel,并在遍历大量其他对象后保存那些"AWT-EventQueue-0" prio=10 tid=0x00007ff38028c000 nid=0x5f74 runnable [0x00007ff3745db000] java.lang.Thread.State: RUNNABLE at javax.swing.text.AbstractDocument$BranchElement.getElementIndex(AbstractDocument.java:2389) at javax.swing.text.CompositeView.getViewIndexAtPosition(CompositeView.java:579) at javax.swing.text.FlowView$LogicalView.getViewIndexAtPosition(FlowView.java:692) at javax.swing.text.CompositeView.getViewIndex(CompositeView.java:497) at javax.swing.text.TextLayoutStrategy$AttributedSegment.getAttribute(TextLayoutStrategy.java:520) at sun.text.bidi.BidiBase.setPara(BidiBase.java:2711) at java.text.Bidi.<init>(Bidi.java:134) at java.awt.font.TextMeasurer.initAll(TextMeasurer.java:208) at java.awt.font.TextMeasurer.<init>(TextMeasurer.java:167) at java.awt.font.LineBreakMeasurer.<init>(LineBreakMeasurer.java:310) 个实例。

    因此,在渲染时间和内存消耗方面,支持某些Unicode子集可能会更加昂贵。我没有发现内存“泄漏”的任何迹象,除了您的示例在JTextPane的样式文档中保留“聊天对话”的完整历史记录的情况。你能做什么?

    • 仅在JTextPane中显示聊天记录的有限部分,例如仅显示最新的 N 条目。

    • 将聊天记录保存在Swing渲染图之外的其他一些数据结构中。你需要管理自己滚动到JTextPane内/外的文本“页面输入”和“页面输出”部分,所以它只需要渲染整个历史记录的一小部分。

    编辑:分析运行#2

    {{1}}

    随着“linebreaks OFF”,性能陨石坑停滞不前。我采用了多个线程转储,常见的是LineBreakMeasurer;我选择了上面的跟踪因为它显示它必须处理“双向”(双向)字符。

    只要我不触摸样式或换行选项,这对我来说似乎不是问题。