如何通过在属性周围添加引号来清理用于Java解析的XML文件

时间:2011-05-13 07:19:04

标签: java xml regex xml-parsing jtidy

我有一系列看起来像这样的xml文件:

<ROOT>
    <F P=100> Some text here </F>
    <F P=101> More text </F>
    ...
</ROOT>

我正在尝试使用标准DOM方式解析xml,但由于P的属性值不在引号中,因此Java抱怨。

我尝试使用JTidy进行清理,但由于我的xml不是HTML,因此Tidy会因为无法识别标记<ROOT><F>等而引发错误。

那么,还有另一种方法吗?或者,我想我可以使用正则表达式,因为<F>标签中只有没有引号的属性。有没有想过?

提前致谢

1 个答案:

答案 0 :(得分:3)

  

我所要做的就是设置tidy.setXmlTags(true)以便整理将输入视为XML而不是HTML

- 谢尔顿