JTidy Node.findBody() - 如何使用?

时间:2008-10-21 09:18:52

标签: java xml xhtml tidy jtidy

我正在尝试使用JTidy进行XHTML DOM解析,这似乎是违反直觉的任务。特别是,有一种解析HTML的方法:

Node Tidy.parse(Reader, Writer)

并获得< body />我假设该节点应该使用

Node Node.findBody(TagTable)

我应该在哪里获得该TagTable的实例? (构造函数受到保护,我还没有找到工厂来生产它。)

我使用JTidy 8.0-SNAPSHOT。

2 个答案:

答案 0 :(得分:6)

我发现提取身体的很多更简单的方法:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

然后在Reader-Writer对上使用整洁。

应该很简单。

答案 1 :(得分:3)

您可以改用parseDOM方法,这会给您一个org.w3c.dom.Document的回复:

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);