对于任何给定的标题或作者,我正在尝试编写一个脚本(现在)加载亚马逊产品页面,并输出页面中“买了这个项目的客户”区域中的项目。我试图将BeautifulSoup指向它,但我不太清楚将它称为什么名称。该部分的h2标题是'a-carousel-heading',我试过但似乎没有用。我也尝试了包含它的div('div a-column a-span8'),但这似乎也没有用。你们中的任何人都可以给我一些关于如何准确引用我正在寻找的区域的指示吗?
book = raw_input('Enter a book title, or an author\'s name! \n')
products = amazon.search_n(1, Keywords=book, SearchIndex='All')
isbn = products[0].isbn
html = urlopen('http://www.amazon.com/gp/product/', isbn)
soup = BeautifulSoup(html.read(), 'html.parser')
for row in soup.select("div.a-column.a-span8"):
print(row)
预期产出:
The Basic Works of Aristotle, Aristotle: Selections, etc..
答案 0 :(得分:1)
您正在查看标题,而不是旋转木马本身。数据存储在:
中<ol class="a-carousel" role="list" aria-busy="false">
..