Question

我试图废弃一个网站。它包含一个足球网站，列出了所有赛季的所有比赛。因此，我试图删除每个赛季每场比赛的html页面以下是网址：http://www.lfp.fr/ligue1/calendrier_resultat#sai=77&jour=1

我在做的是：

url = 'http://www.lfp.fr/ligue1/calendrier_resultat#'
data = {'sai':77,'jour':10}
url_values = urlencode(data)
response = urlopen(url,url_values)
soup = BeautifulSoup(response)

sai是赛季和jour是一周

问题是所给出的页面仅取决于＆＃39; sai＆＃39;价值，无论什么＆＃39; jour＆＃39;等于，它将始终返回相同的页面，它将始终是最后一周。

例如，我可以输入这样的网址： http://www.lfp.fr/ligue1/calendrier_resultat#sai=77OUHIGYGO8TY98 在sai = 77之后，它永远不会关心。我不知道为什么会这样做，我真的需要一些帮助。感谢

Answer 1

感谢其他一些stackoverflow帖子的答案，我终于解决了这个问题。

这里的问题是＃之后的URL部分是永远不会发送到服务器的客户端部分。实际上，有一个真正的URL发送到服务器，我发现它使用Mozilla：您只需转到开发人员工具并转到网络选项卡。滚动浏览左侧的选项卡元素，对于每个元素，您将看到相应的“请求URL”。如果你注意，你会找到一个正确的元素，其请求URL看起来像带有＃符号的URL。只需复制粘贴即可解决问题。

python urlopen：只有URL的第一个属性是通过数据获取的

1 个答案: