使用PyQuery要求网页按邮政编码搜索结果

时间:2013-07-01 19:08:58

标签: python web-crawler pyquery

我是抓取数据的新手。

现在我必须使用Pyquery通过网站上的邮政编码来抓取美国的学校信息,http://www.greatschools.org/find-schools

每次输入邮政编码时,搜索页面的网址都非常复杂。我认为Pyquery很难对这种网址进行编程。

例如,当我输入邮政编码95113时,结果页面的网址就是 http://www.greatschools.org/search/search.page?lat=37.3326639&lon=-121.89183639999999&state=CA&locationType=postal_code&sortBy=DISTANCE&normalizedAddress=San+Jose%2C+CA+95113&totalResults=1&city=San+Jose&zipCode=95113&locationSearchString=95113&distance=5

我的问题: 如果我想从结果页面抓取数据,我如何使用Pyquery获取结果页面? 我似乎可以通过编程来构成搜索结果的网址,但创建时间过长,并且需要搜索数千个邮政编码。

有没有更好的解决方案?

1 个答案:

答案 0 :(得分:0)

您可以使用:

PyQuery(url='http://')

然后废弃:

for a in doc('a').items():
    PyQuery(url=a.attr.href)