加载没有转义引号的xml文件

时间:2014-07-21 11:51:13

标签: java xml parsing tableofcontents

我有一个包含内容列表的xml文件。问题是,它包含未转义的引号。如何加载文件并修复此引号?

<?xml version="1.0" encoding="UTF-8"?>
<?NLS TYPE="org.eclipse.help.toc"?>

<topic label="Main Topic" href="0.2.1.html#0.2.5">
    <topic label="Topic "Sales"" href="0.2.1.html#2.12.3.6"/>
</topic>

我知道在标准中停留:

In the content of elements, character data is any string of characters which does not contain the start-delimiter of any markup

源代码不会转义引号,我无法更改源代码。如何在本地修复xml文件?

1 个答案:

答案 0 :(得分:0)

当它不是

时,不要把它称为XML。

如果要处理此文件,您需要发现它符合的规则(语法),并为该语法编写解析器。这可能相当困难;我怀疑语法,当你发现它时,将是模棱两可的,需要无限的前瞻来解决。