我试图用jSoup刮取网站的价格,但我只得到一个空字符串。
我使用jSoup Online测试了我的代码,并且当我使用以下代码时,我希望打印<meta itemprop="price" content="6,99">
:
Document doc = Jsoup.connect(URL).get();
Elements meta = doc.select("meta[itemprop=price]");
System.out.println("meta: " + meta.text());
price = meta.attr("content");
但是,我只是得到一个空字符串,没有错误。我在这里做错了什么?
对于那些感兴趣的人,我试图榨取this page
的价格答案 0 :(得分:2)
试试这个:
Document doc = Jsoup.connect(URL).get();
Element meta = doc.select("meta[itemprop=price]").first();
System.out.println("meta: " + meta.text());
String price = meta.attr("content");
答案 1 :(得分:1)
您尝试访问的网络服务器需要另一个用户代理字符串来响应您想要的信息。试试这个:
Document doc = Jsoup.connect(URL).userAgent("Mozilla/5.0").get();