获取图像的动态src

时间:2013-01-27 14:26:10

标签: python urllib

我有一个<img /> src属性是由javascript脚本动态设置的 - 所以它现在是<img src="http://1.2.3.4/some_image.jpg?m=3681368312" />,后来是<img src="http://1.2.3.4/some_image.jpg?m=1234234" />。我想用python加载这个图像并保存它。问题是,当我加载html时,src属性为空 - 它稍后设置,所以当我加载它时,我得到<img src="" />。第二个问题是地址的IP部分可能随时间而变化。我希望我的解决方案是通用的,并且当提供者方面的某些内容发生变化时,不必更改我的代码。有没有办法加载这个动态变化的内容?

编辑:

当然我知道,我可以对javascript行为进行逆向工程 - 解析js脚本,获取当前加载的ip并生成随机令牌,但我想避免这种情况......

1 个答案:

答案 0 :(得分:0)

要获取'src'或'img'而不对javascript进行逆向工程,您必须在“浏览器”中执行它。

在python中,为此,我使用PyQt4(QtCore,QtGui,QtWebKit)

以下是一个示例:https://github.com/JulienPalard/PyWebScrap