我有一个<img />
src属性是由javascript脚本动态设置的 - 所以它现在是<img src="http://1.2.3.4/some_image.jpg?m=3681368312" />
,后来是<img src="http://1.2.3.4/some_image.jpg?m=1234234" />
。我想用python加载这个图像并保存它。问题是,当我加载html时,src属性为空 - 它稍后设置,所以当我加载它时,我得到<img src="" />
。第二个问题是地址的IP部分可能随时间而变化。我希望我的解决方案是通用的,并且当提供者方面的某些内容发生变化时,不必更改我的代码。有没有办法加载这个动态变化的内容?
编辑:
当然我知道,我可以对javascript行为进行逆向工程 - 解析js脚本,获取当前加载的ip并生成随机令牌,但我想避免这种情况......
答案 0 :(得分:0)
要获取'src'或'img'而不对javascript进行逆向工程,您必须在“浏览器”中执行它。
在python中,为此,我使用PyQt4(QtCore,QtGui,QtWebKit)