我想抓取http://www.narrpr.com/数据,但我遇到了问题。大多数情况下,格式化URL以访问您要抓取的特定页面很容易。但是,在这种情况下,URL的格式为以下方式(例如):
http://www.narrpr.com/homes/mo/independence/64055/2412-s-ellison-way/38664800-summary.aspx
数字38664800
似乎是某种唯一ID。
手动浏览网站时,我会在表单中输入2412 S Ellison Way
,然后将其重定向到上面的网址。
如何以编程方式访问正确的页面而无需知道该ID?或者,我如何获得该ID?
感谢。