使用DOM解析XML注释

时间:2013-11-15 08:24:54

标签: java xml parsing dom xml-parsing

我需要解析像

这样被注释掉的XML标签
<DataType Name="SecureCode" Size="4" Type="NVARCHAR">
    <!-- <Validation>
            <Regex JavaPattern="^[0-9]*$" JSPattern="^[0-9]*$"/>
    </Validation> -->
    <UIType Size="4" UITableSize="4"/>
</DataType>

但我发现的只有setIgnoringComments(boolean)

Document doc = docBuilder.parse(new File(PathChecker.getDataTypesFile()));
docFactory.setIgnoringComments(true); // ture or false, no difference

但它似乎没有改变任何东西。 有没有其他方法来解析这些评论?我必须使用DOM。

此致

2 个答案:

答案 0 :(得分:5)

方法“setIgnoringComments”在解析期间从DOM树中删除了注释。 使用“setIgnoringComments(false)”,您可以获得评论文本,如:

    NodeList nl = doc.getDocumentElement().getChildNodes();
    for (int i = 0; i < nl.getLength(); i++) {
        if (nl.item(i).getNodeType() == Element.COMMENT_NODE) {
            Comment comment=(Comment) nl.item(i);
            System.out.println(comment.getData());
        }
    }

答案 1 :(得分:0)

由于似乎不存在解决问题的“常规方法”,我刚刚删除了评论。

BufferedReader br = new BufferedReader(new FileReader(new File(PathChecker.getDataTypesFile())));
BufferedWriter bw = new BufferedWriter(new FileWriter(new File(PathChecker.getDataTypesFileWithoutComments())));

String line = "";

while ((line = br.readLine()) != null) {
    line = line.replace("<!--", "").replace("-->", "") + "\n";
    bw.write(line);
}