我想在我的应用中解析HTML内容。 我想使用HtmlCleaner来做到这一点。
我知道HtmlCleaner将html转换为xml。 我熟悉解析xml所以我想这样做。
我有这一行:
tagNode = new HtmlCleaner(props).clean(new URL( “http://somewebsite.com”));
我获得了tagNode内容。 有没有办法查看HtmlCleaner返回的XML内容? 写它文件或其他东西,所以我可以写属性XML解析器。
TNX。
答案 0 :(得分:1)
您可以将其写入文件。这来自HtmlCleaner Java use:
final CleanerProperties props = new CleanerProperties();
final SimpleHtmlSerializer htmlSerializer = new SimpleHtmlSerializer(props);
htmlSerializer.writeToFile(tagNode, fileName, "utf-8");
您可能需要捕获writeToFile()
可能抛出的IOException。