使用Jsoup解析Amazon / Flipkart产品页面

时间:2015-03-06 20:35:04

标签: java javascript hyperlink web-scraping jsoup

亚马逊针对不同的网页有不同的标签。

在使用Jsoup进行解析时,需要指定确切的标记。

这变得有点困难,因为无法检查/枚举所有页面上的所有不同标签。

示例:以下3个页面具有不同的图像和名称标记:

Product link 1

标签:" span#productTitle"," img#landingImage"

Product link 2

标签:" span#btAsinTitle"," img #main-image"

Product link 3

标签:" #title_feature_div h1"," #coverArt_feature_div img"

是否有处理所有这些不同情况的库或代码?

0 个答案:

没有答案