如何访问网页内容

时间:2015-02-11 09:44:20

标签: java html web web-crawler jsoup

我将网页的文字存储在字符串中。但网页的某些内容未存储在字符串中。我不知道为什么没有存储div元素中的内容。甚至div中的链接也无法使用我已实现的网络爬虫访问。任何人都可以帮我解决这个问题!!!。

 List<String> tags = new ArrayList<String>();
for(int i=0;i<8;i++)
{
Document doc = Jsoup.connect("some link here").get();
Elements taglinks = doc.select("html");
for (Element link : taglinks) {
tags.add(link.text());}
System.out.println(tags);

1 个答案:

答案 0 :(得分:0)

您的问题还不够清楚,但是从我们的代码中我了解到您正在寻找,保存链接文本并使用您必须使用的.select()语法  doc.select("a[href"]); 然后你可以使用你的当前循环。