拉网页源python时出错数据

时间:2013-06-11 05:17:19

标签: python http web urllib2

我正在使用以下python代码:

def get_data(self, url):
    usock = urllib2.urlopen(url)
    data = usock.read()
    usock.close()
    return data

要解析来自某个网​​站的数据,它会工作一段时间。 现在出了点问题。
当我现在使用这个函数时,它给了我一个源代码但不同于它的源代码 当您打开view-source: url
时 我在常规网站视图中使用chrome。有没有办法通过使用“查看源”选项获得相同的源代码?感谢。

1 个答案:

答案 0 :(得分:0)

我不使用Chrome,但可能“查看源代码”显示包含JavaScript生成内容的来源吗?而您的Python代码返回“原始”内容。

请注意,某些网站会根据客户端(以及它的功能)返回不同的内容。

所有这些都是推测性的,为了“公平”比较,您可以将结果与使用wgetcurl获得的结果进行比较。