为url解析一些代码

时间:2011-06-29 10:49:25

标签: parsing web-scraping

我必须提取一些网页代码:* http://www.bebesymas.com/edades/bebes-de-menos-de-6-meses/bebe-de-4-meses 我想要提取的问题是当我点击“Leer Mas”图标时。使用Firebug,我发现它似乎执行了一些Ajax代码。我怎样才能提取正确的URL以提取我想要的内容。非常感谢和抱歉我的英语

1 个答案:

答案 0 :(得分:0)

如果您查看Firebug中的NET标签,您会看到点击该链接时会抓取此网址:

http://www.bebesymas.com/json/productdesc/20351/27211

现在,如果您搜索27211的HTML,您会发现:

enter image description here

所以你只需要从这两个元素中获取productid和postid,然后像这样构造URL:

http://www.bebesymas.com/json/productdesc/的productid /帖子ID