Python请求模块 - 结果与chrome

时间:2015-08-14 14:30:38

标签: python web-scraping

我尝试废弃此网址:http://www.timeanddate.com/holidays/us/2013#!hol=25

具体来说,我希望所有来自美国的特别日期 - 2013年的过滤器"假期和一些纪念活动"。当我去http://www.timeanddate.com/holidays/us/2013我可以看到很多假期后,我应用了"假期和一些纪念活动"过滤我看到一张表,其中包含我要废弃的所有假期。使用"检查元素" chrome的功能我发现假期表还包含所有假期,但隐藏的假期表有#34; dn"。因此,我使用BeautifulSoap来过滤掉所有节假日的课程' dn'并期望只有我点击http://www.timeanddate.com/holidays/us/2013#!hol=25

时才能看到的

不幸的是,到目前为止还没有成功。

r =  requests.get("http://www.timeanddate.com/holidays/us/2013#!hol=25")
print(r.url)
> http://www.timeanddate.com/holidays/us/2013#!hol=25   #URL seems to be right

soup = BeautifulSoup(r.content, "lxml")

n = 0
for link in soup.find_all('tr'):
   if link.get('class')[0] != 'head':  #removes the 2 head rows of the table
       if link.get('class')[0] != 'dn':
          n += 1
print(n)
> 197  # instead of 17 as in Chrome

由于请求似乎以正确的方式处理网址,我不知道为什么我没有得到与Chrome相同的结果?

请求()是否可能无法处理"#!hol = 25" URL的一部分?

0 个答案:

没有答案