Python网络爬虫没有输出

时间:2017-10-15 18:17:44

标签: python web-crawler

我试图创建我的第一个python web爬虫(从newboston学到它)。我没有得到任何错误消息,但也没有输出.. 继承我的代码:

import requests
from bs4 import BeautifulSoup

def sportpoint_spider(max_pages):
    page = 1
    while page <= max_pages:
        url = 'http://www.sportpoint.lt/vyrams-1?page=' + str(page)
        source_code = requests.get(url)
        plain_text = source_code.text
        soup = BeautifulSoup(plain_text, "html.parser")
        for link in soup.findAll('a', {'atl '}):
            href = link.get('href')
            print(href)
        page += 1

sportpoint_spider(1)

1 个答案:

答案 0 :(得分:2)

你的问题就在这一行

for link in soup.findAll('a', {'atl '}):

根据docs第二个参数attrs应该是一个包含{'attr_name': 'attr_value'}对的字典。 {'atl '}set。另外,我认为您的意思是'alt',而不是'atl'。尝试使用

for link in soup.findAll('a'):

页面上没有'a'元素,其中包含属性'alt'