我正在编写一个简单的脚本来废弃python中的Amazon wishlist。在过去的几个月里,这个剧本运作得很好。但它最近停止了工作。示例代码如下
from BeautifulSoup import BeautifulSoup
import urllib2
downloadpage = urllib2.urlopen("http://www.amazon.com/gp/registry/wishlist/2VMALIPGUJ17Q/ref=topnav_lists_1").read()
soup = BeautifulSoup(downloadpage)
我发现downloadpage
是正确的网页(如果你打印出来,你可以看到它)。然而,汤会给我一个完全不同的页面。我不明白这种行为背后的原因?亚马逊试图阻止人们解析其网页吗?