我正在尝试从Google购物中提取产品名称信息(http://www.google.co.uk/m/products?q=5010459007289,电话网站)。
产品名称始终显示在类别为“owb63p”的范围之间,例如
"<span class="owb63p">Highland Spring Sports Bottle 750 Ml</span>"
我是JSoup的新手,我可以连接URL并获取整个文档,但我只需要帮助设置它,这样我就只能得到我需要的信息。
由于
答案 0 :(得分:1)
在JSoup中,它将像:
Document doc = Jsoup.connect("www.google.co.uk/m/products?q=5010459007289").get();
Element title = doc.select("span.owb63p").first();
System.out.println(title.text());
答案 1 :(得分:0)
我不太喜欢JSoup,但是希望apache jericho:
Source source=new Source(new URL(sourceUrlString));
String content=source.getFirstElementByClass( "owb63p" ).getContent().toString();
答案 2 :(得分:0)
看起来JSoup examples有你想要的东西。
答案 3 :(得分:0)
你可以尝试
doc.select("span").get(0).data();
或者您可以简单地迭代多个span标签...