如何从Java中的HTML文件中获取值?

时间:2011-01-04 16:12:44

标签: java parsing html-parsing

我需要从HTML文件中获取一个值(下例中为“abc”),如下所示:

          <input type="hidden" name="something" value="abc" />

正如我从其他帖子中发现的那样,我应该使用其中一个HTML解析器(而不是正则表达式)。您能否告诉我使用哪一个或显示代码示例。

谢谢。

2 个答案:

答案 0 :(得分:4)

您可以使用Jsoup

File file = new File("/path/to/file.html");
Document document = Jsoup.parse(file, "UTF-8");
Element something = document.select("input[name=something]").first();
String value = something.val();
System.out.println(value); // abc
// ...

或更短:

String value = Jsoup.parse(new File("/path/to/file.html"), "UTF-8").select("input[name=something]").first().val();
System.out.println(value); // abc
// ...

另见:

答案 1 :(得分:1)