网页及其下载的源代码是不同的。奇怪但真实。!

时间:2013-05-06 15:39:11

标签: twitter web

我正在通过Twitter网页浏览我的项目。发现了这个问题 例如
网页:https://twitter.com/SrBachchan
页面源(在浏览器中通过右键单击查看):
视图源:https://twitter.com/SrBachchan

通过curl命令下载源代码。下载的源代码(通过curl)与原始源代码不同。

我也尝试使用python下载源代码(使用urllib2.urlopen)。它与卷曲获得的相同。

任何人都可以对此有所了解。?

1 个答案:

答案 0 :(得分:1)

我自己找到了解决方案。 需要添加标题'--header“Accept-Language:en”'以获取该语言的确切源代码。

E.g。 curl --header“Accept-Language:en”https://twitter.com/SrBachchan可以胜任。