使用美丽的汤搜索日期范围

时间:2017-01-24 23:08:55

标签: python beautifulsoup findall

我正在尝试使用精美的汤从网站https://apod.nasa.gov/apod/archivepix.html下载图片。这是具体的代码:

def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
    urls.append(result['href'])

我的问题是:每次我运行代码所有图片下载(70,000多)。如何使用findAll将日期范围限制为例如100或日期之间?任何帮助非常感谢。

1 个答案:

答案 0 :(得分:0)

您可以使用限制参数

results = ...findAll('a', limit=100)