jTidy和TagSoup文档

时间:2010-12-15 16:49:58

标签: java jtidy tag-soup jericho-html-parser

我正在为TagSoup和jTidy库寻找文档(如果可能的话正式文档)。

我想使用这个库来操作html“tagsoup”文件,这些文件包含在html(html,xhtml或html5)标记之间混合了不同命名空间的xml标记。

我测试了HTMLCleaner,NekoHTML和Jericho,但我没有找到jTidy和TagSoup的文档,除了清除文件的最简单的例子。

我需要有关操纵内容,替换标签,提取信息等的文档......

由于

注意: 测试完所有选项后,我使用 StAX / Woodstox

1 个答案:

答案 0 :(得分:2)

关于tagsoup-friends google群组的类似问题的答案可能有所帮助:

Documentation for TagSoup

您可能已经看过它们了,但是JTidy的javadoc可以在这里找到:http://jtidy.sourceforge.net/apidocs/index.html