我将网页的文字存储在字符串中。但网页的某些内容未存储在字符串中。我不知道为什么没有存储div元素中的内容。甚至div中的链接也无法使用我已实现的网络爬虫访问。任何人都可以帮我解决这个问题!!!。
List<String> tags = new ArrayList<String>();
for(int i=0;i<8;i++)
{
Document doc = Jsoup.connect("some link here").get();
Elements taglinks = doc.select("html");
for (Element link : taglinks) {
tags.add(link.text());}
System.out.println(tags);
答案 0 :(得分:0)
您的问题还不够清楚,但是从我们的代码中我了解到您正在寻找,保存链接文本并使用您必须使用的.select()
语法
doc.select("a[href"]);
然后你可以使用你的当前循环。