BeautifulSoup在亚马逊页面上不起作用

时间:2014-08-28 19:01:56

标签: python web-scraping beautifulsoup amazon

我正在编写一个简单的脚本来废弃python中的Amazon wishlist。在过去的几个月里,这个剧本运作得很好。但它最近停止了工作。示例代码如下


from BeautifulSoup import BeautifulSoup
import urllib2
downloadpage = urllib2.urlopen("http://www.amazon.com/gp/registry/wishlist/2VMALIPGUJ17Q/ref=topnav_lists_1").read()
soup = BeautifulSoup(downloadpage)

我发现downloadpage是正确的网页(如果你打印出来,你可以看到它)。然而,汤会给我一个完全不同的页面。我不明白这种行为背后的原因?亚马逊试图阻止人们解析其网页吗?

0 个答案:

没有答案