使用BeautifulSoup(Python)将电影刮到列表中

时间:2018-05-28 14:14:11

标签: python html web-scraping beautifulsoup

我开始用Python编写代码(3)。我想提取一些与电影有关的数据,这里是list link

我已经删除了与投票数相关的数据:

first_votes = first_movie.find('span', attrs = {'name':'nv'})
first_votes

first_votes['data-value']

这完全取决于用户对电影进行评分的次数。

但是当我试图削减总金额时,我真的不知道如何使代码集中在总数上,因为总票数和票数都具有相同的结构:

This is what the DevTool shows

你们有谁知道如何解决这个问题?对不起,如果我没有提供任何其他信息,但我是新的。如果您需要一些信息,我很乐意提供这些信息。

2 个答案:

答案 0 :(得分:0)

您可以使用findAll方法获取符合条件的所有元素的列表,然后您可以选择列表中的第二个元素,例如:

first_votes = first_movie.findAll('span', attrs = {'name':'nv'})[1]

答案 1 :(得分:0)

您可以针对votesgross

尝试此操作
votes = first_movie.find_all('span', attrs = {'name':'nv'})[0]['data-value']
gross = first_movie.find_all('span', attrs = {'name':'nv'})[1]['data-value']

或单行

votes, gross = [item['data-value'] for item in first_movie.find_all('span', attrs = {'name':'nv'})]