解析网页的Java在背景中

时间:2015-10-11 08:34:34

标签: java

我需要从书签(在Java程序中)访问所有链接。 我知道如何从书签中获取链接,但我不知道如何打开每个链接(在后台),然后从一些单词键中搜索。

例如,我从书签中取出http://www.bbc.com/earth/story/20151009-where-is-the-windiest-place-on-earth,我想从该位置解析页面(但未在网络浏览器中打开),以查找“north”一词出现的次数。

是的,有人能帮帮我吗?

1 个答案:

答案 0 :(得分:1)

您需要一些了解DOM的Java库。请尝试JSoup