我试图获取http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400的渲染标记;从理论上讲,“查看页面来源”给出了相同的标记。 Firefox中的菜单选项。
我使用的是Python 2.7脚本和 httplib 库 (http://docs.python.org/2/library/httplib.html) 。我创建了一个HTTPConnection对象,当我尝试通过HTTPResponse对象的函数获取标记时,我不可避免地得到 getaddrinfo - 11004 错误。此脚本已在Windows 7和Ubuntu环境中执行。
我读过的这个错误的其他解决方案都没有符合要求:我没有任何防火墙,我没有问题ping www.google.com。我想知道这个网站是否符合某些我不知道的标准,因为我还没有能够成功ping我的目标网站。
我对替代方法持开放态度,如果有更好的方法,请告诉我。
答案 0 :(得分:0)
您可能想要查看reqests
库。它使这样简单的事情变得更加容易:
import requests
r = requests.get('http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400')
print r.text
以下是文档:http://docs.python-requests.org/en/latest/
如上所述并验证其有效。