我是Jsoup
的新手并且正在学习它
我想从Imdb网站/特定电影链接中提取评级,发现我可以通过class = star-box-details
从div获取,因此我编写了以下代码:
public static void main(String [] args)
{
try {
Elements data;
String userAgent = "ExampleBot 1.0 (+http://example.com/bot)";
String url = "http://www.imdb.com/title/tt0114746/";
data = Jsoup.connect(url).userAgent(userAgent).get().select("div.star-box-details").select("[href]");
System.out.println(data);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
我很难得到没有数据,因为我可以在几周后获得评级数据。并且页面/网址上存在带有class = star-box-details
的div。
答案 0 :(得分:1)
该网站可能会过滤该特定用户代理,导致无法返回内容。你可以用
String userAgent = "Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6";