我必须从一些网站上删除产品的图像,我使用javascript来抓它。 到目前为止,我已经成功地抓取了图像,如下所示
var images = document.images;
for (var i = 0; i < images.length; i++) {
img = images[i];
我也想从文件中榨取价格。我知道这是可能的,一些网站已经在做这个,但不知道如何。 类似于通过文档文本匹配“价格”字符串似乎是一种可能性但不确定如何做到这一点,也有更好的方法。 任何指针?
答案 0 :(得分:1)
这取决于您对相关网页的了解程度。如果你是盲目的,你总是可以使用像document.body.innerHTML.match(/£\d+\.\d+/g)
那样可怕的东西(或类似的东西,取决于货币)。无论哪种方式,您都需要在页面中查找和匹配模式,并从那里获取价格。
奖励积分:看看他们是否有谷歌基础饲料(不受保护) - 你会惊讶于有多少人这样做。这将(通常)是一个XML提要,包含您可能需要的所有内容。