我们已经使用jsoup lib获取了URL并存储在数据库中。现在我们正在寻找数据并在db中存储,但我们只查找特定字段,而不是存储整个页面。 例如:http://www.flipkart.com/shoes/ 当我们获取此链接时,我们需要品牌,价格,评论等领域。 用java代码!! 请帮忙 !
答案 0 :(得分:-1)
有两种方法可以过滤掉整个内容,
Regex
并提取所需的字段。xpath
,您可以提取所需的字段(首选和推荐的解析方式)。regex
模式。 String
并应用模式并检索数据。html/xml
形式获取回复,并在检索到的内容上应用xpath
并获取数据。