我需要解析一个包含简单表单的简单HTML页面。 StackOverflow上类似问题的答案建议使用各种非标准Java库之一,如TagSoup,JSoup,HTMLParser等等。
但是,网络搜索显示Java SE中存在一些标准功能:http://docs.oracle.com/javase/7/docs/api/javax/swing/text/html/parser/ParserDelegator.html
我的子问题是:
谢谢。
答案 0 :(得分:2)
JDK内置HTML解析器,支持HTML 1.0左右。它应该支持解析基本文本格式标签和表单。
使用其他第三方解析器的原因是需要支持“真实”HTML页面DHTML,JavaScript等。
JSoup是可以完成这项工作的流行解析器之一。有关其他实现的更多信息,请查看以下讨论: