使用python返回原始url源代码

时间:2017-05-02 14:05:48

标签: python html

我使用python从URL检索源代码,但是有问题的URL具有在加载页面时评估的脚本。因此,当使用python时,返回的html的主体是空的,但是当我手动访问网页时,它会显示html代码正文中的各种帖子。有没有办法强制它填充和评估html?

简而言之,当我使用文件>在HTML页面上的Chrome中保存按钮,生成的html代码与使用python保存的HTML不匹配。我怎么解决这个问题?

f = urllib2.urlopen(url)
html = f.read()

1 个答案:

答案 0 :(得分:0)

您需要使用的是一个可以解释javascript的网络浏览器工具:splinter