来自requests.get的源代码与网站源代码不匹配

时间:2019-07-03 08:22:22

标签: python python-requests

我正在尝试构建一个机器人来从https://matcherino.com/tournaments/17147/overview中检索一个特定值,但是使用request.get会提取与该站点不匹配的源代码。似乎是拉起了聊天机器人的源代码,以便与网站的创建者对话。

import requests
s = requests.Session()
s.get('https://matcherino.com')
r = s.get('https://matcherino.com/tournaments/17147/overview')
print(r.text)

很抱歉没有这么说,但我正试图从网站上刮掉奖池金额。

1 个答案:

答案 0 :(得分:0)

通过查看页面的源代码,您可以看到奖池不存在,因此它是由Javascript动态加载的,检索信息会更加复杂

我从没有尝试过,但是看来您可以在这里找到解决方案:https://towardsdatascience.com/data-science-skills-web-scraping-javascript-using-python-97a29738353f