我有以下代码可以从HTML文档中提取数据。我用过eclipse。它给了我两个错误(但是,这个代码是作为教程从JSoup站点复制和粘贴的)。 1)文件和2)元素中的错误。我看不出这两种类型有什么问题。
import java.io.IOException; import java.net.MalformedURLException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class TestClass
{
public static void main(String args[]) throws IOException
{
try{
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}
}//try
catch (Exception e){//Catch exception if any
System.err.println("Error: " + e.getMessage());
}//catch
}
}</i>
答案 0 :(得分:2)
你忘记了import
他们。
import java.io.File;
import org.jsoup.select.Elements;
提示:阅读 Eclipse建议的“快速修复”选项。它已经是File
的第一个选项。