如何从Java网页获取信息?

时间:2011-06-16 15:55:24

标签: java html file-io jsoup

有没有人知道我可以通过Java网页获取信息的快捷方式?例如,如果我正在查看这样的页面:http://www.ncbi.nlm.nih.gov/pubmed/?term=10952317并且我想提取标题“MeSH Terms”下面的单词列表,我将如何进行此操作?

我有一些东西可以读取来源,但它充满了HTML标签等......

非常感谢任何帮助!

2 个答案:

答案 0 :(得分:3)

正如前面已经提到过的无数次,看看JSoup,这是一个用于Java的HTML解析库。或者自己写(不推荐)。

答案 1 :(得分:0)

可能TagSoup适合你。