我正在通过Twitter网页浏览我的项目。发现了这个问题
例如
网页:https://twitter.com/SrBachchan
页面源(在浏览器中通过右键单击查看):
视图源:https://twitter.com/SrBachchan
通过curl命令下载源代码。下载的源代码(通过curl)与原始源代码不同。
我也尝试使用python下载源代码(使用urllib2.urlopen)。它与卷曲获得的相同。
任何人都可以对此有所了解。?
答案 0 :(得分:1)
我自己找到了解决方案。 需要添加标题'--header“Accept-Language:en”'以获取该语言的确切源代码。
E.g。 curl --header“Accept-Language:en”https://twitter.com/SrBachchan可以胜任。