我正在尝试使用Python请求库从Workflowy获取一些信息。基本上我正在尝试以编程方式获取此网址下的内容:https://workflowy.com/s/XCL9FCaH1b
问题是当我访问这个网站时,在显示实际内容之前,Workflowy会经历一个“加载阶段”,所以当我收到请求时,我最终会得到“加载”页面的内容。基本上我需要一种方法来推迟获取内容,以便我可以绕过加载阶段。
似乎Requests库在这里讨论这个问题:http://www.python-requests.org/en/latest/user/advanced/#body-content-workflow但我无法让这个例子适用于我的目的。
这是超级简单的代码块,最终得到了“加载页面”:
import requests
path = "https://workflowy.com/s/XCL9FCaH1b"
r = requests.get(path, stream=True)
print(r.content)
请注意,我不必使用请求,因为看起来它可能会解决我的问题。目前还在使用Python 2.7。
非常感谢你的时间!