Question

我有一系列看起来像这样的xml文件：

<ROOT>
    <F P=100> Some text here </F>
    <F P=101> More text </F>
    ...
</ROOT>

我正在尝试使用标准DOM方式解析xml，但由于P的属性值不在引号中，因此Java抱怨。

我尝试使用JTidy进行清理，但由于我的xml不是HTML，因此Tidy会因为无法识别标记<ROOT>和<F>等而引发错误。

那么，还有另一种方法吗？或者，我想我可以使用正则表达式，因为<F>标签中只有没有引号的属性。有没有想过？

提前致谢

Answer 1

我所要做的就是设置tidy.setXmlTags（true）以便整理将输入视为XML而不是HTML

- 谢尔顿