我试图废弃一个网站。 它包含一个足球网站,列出了所有赛季的所有比赛。 因此,我试图删除每个赛季每场比赛的html页面 以下是网址:http://www.lfp.fr/ligue1/calendrier_resultat#sai=77&jour=1
我在做的是:
url = 'http://www.lfp.fr/ligue1/calendrier_resultat#'
data = {'sai':77,'jour':10}
url_values = urlencode(data)
response = urlopen(url,url_values)
soup = BeautifulSoup(response)
sai是赛季
和jour是一周
问题是所给出的页面仅取决于' sai'价值,无论什么' jour'等于,它将始终返回相同的页面,它将始终是最后一周。
例如,我可以输入这样的网址: http://www.lfp.fr/ligue1/calendrier_resultat#sai=77OUHIGYGO8TY98 在sai = 77之后,它永远不会关心。 我不知道为什么会这样做,我真的需要一些帮助。 感谢
答案 0 :(得分:0)
感谢其他一些stackoverflow帖子的答案,我终于解决了这个问题。
这里的问题是#之后的URL部分是永远不会发送到服务器的客户端部分。实际上,有一个真正的URL发送到服务器,我发现它使用Mozilla:您只需转到开发人员工具并转到网络选项卡。滚动浏览左侧的选项卡元素,对于每个元素,您将看到相应的“请求URL”。 如果你注意,你会找到一个正确的元素,其请求URL看起来像带有#符号的URL。只需复制粘贴即可解决问题。