编写用于屏幕刮擦的爬行器

时间:2010-03-26 12:37:22

标签: asp.net screen-scraping web-crawler

我想编写用于屏幕抓取的抓取工具

我想要的是,我想从网站获得特定酒店的价格,就像这里一样 website

e.g。在上面的URL中,有酒店列表及其价格。我想得到 the beaufort

的价格

请告知如何做到这一点。

2 个答案:

答案 0 :(得分:2)

使用像html agility pack这样的HTML解析库将html解析为更实用的模型,然后导航模型以找到您感兴趣的HTML位

答案 1 :(得分:0)

使用cURL等工具下载HTML,然后使用XPath选择您感兴趣的标记。使用Firebug帮助您确定XPath。