用于抓取HTML的Jsoup和相同的不匹配错误

时间:2014-02-16 22:57:54

标签: java html jsoup

我尝试了自己的一个已经从wiki主页上抓取html,就像JSoup.org上的建议样本一样,但是当我尝试使用简单的for循环打印出来时我遇到了类似的错误/它说你无法使用。元素大小。

      for(int d=1; d<= newsHeadlines.size(); d++)

然后我尝试了一个发布在这里的例子,我收到了这个错误

   Exception in thread "main" java.lang.Error: Unresolved compilation problems: 
Type mismatch: cannot convert from org.jsoup.select.Elements to javax.lang.model.util.Elements

Can only iterate over an array or an instance of java.lang.Iterable
  at grabdatafromHTML.Main.main(Main.java:23)

我不确定为什么我会在下面的代码中收到此错误,非常感谢帮助。 谢谢:))

package grabdatafromHTML;

import java.util.List;

import javax.lang.model.util.Elements;

import org.jsoup.select.*; 
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;

public class Main {

public static void main(String[] args) {

    try{

        String url = "http://en.wikipedia.org/wiki/Data_scraping#Screen_scraping";  

        // Download the HTML and store in a Document
        Document doc = Jsoup.connect(url).get();

        // Select the <p> Elements from the document    
        Elements paragraphs = doc.select("p");

        // For each selected <p> element, print out its text
        for (Element e : paragraphs) {
            System.out.println(e.text());
        }   



}
    catch (Exception e){
        System.out.println("some error");
    }
}


   }

1 个答案:

答案 0 :(得分:3)

删除导入

import javax.lang.model.util.Elements;

允许使用类org.jsoup.select.Elements(您已经导入)