我是抓取数据的新手。
现在我必须使用Pyquery通过网站上的邮政编码来抓取美国的学校信息,http://www.greatschools.org/find-schools
每次输入邮政编码时,搜索页面的网址都非常复杂。我认为Pyquery很难对这种网址进行编程。
我的问题: 如果我想从结果页面抓取数据,我如何使用Pyquery获取结果页面? 我似乎可以通过编程来构成搜索结果的网址,但创建时间过长,并且需要搜索数千个邮政编码。
有没有更好的解决方案?
答案 0 :(得分:0)
您可以使用:
PyQuery(url='http://')
然后废弃:
for a in doc('a').items():
PyQuery(url=a.attr.href)