应用错误收集

我正在开发一个Java程序，它读取HTML代码，解析HTML，获取内容（人类可读的文本）并将其存储在XML文件中。有时，HTML代码包含'，"个字符（以及其他字符），但有时它们也分别写为'和"。

我按照适当的程序构建XML。我使用Document和Element类，并使用Transformer，DomSource和StreamResult类创建XML文件。

问题是，保存文件后，我发现&符号已替换为&。我知道这是对的。但它也将'转换为&&apos！

我还尝试将Document对象转换为String对象，然后将该字符串传递给StringEscapeUtils.unescapeXml(String s)方法，以保持XML实体的完整性。但是，它不会将&实体转换为&，从而导致XML文件无效。

（我已将OutputKeys.ENCODING设置为＆＃34; UTF-8＆＃34;并将OutputKeys.METHOD设置为＆＃34; xml＆＃34 ;.）