Python使用PHP抓取页面源代码

时间:2013-02-24 22:52:23

标签: python python-3.3

我知道如何使用内置函数来获取源HTML而不是PHP?

2 个答案:

答案 0 :(得分:1)

通过“抓取源HTML”,我认为你的意思是打开并阅读这样的网页:

impor urllib2
urllib2.urlopen("http://google.com").read()

由于PHP是在服务器端呈现的,并且客户端(您和您的python脚本)无法访问它,因此无法以类似于从网页中提取HTML的方式获取它

答案 1 :(得分:0)

PHP脚本在服务器端运行并生成HTML文档(以及其他内容)。在请求网站时,您永远不会看到HTML文档的PHP源代码,因此Python也无法抓住它。这甚至与Python无关。