Question

我正在尝试使用精美的汤从网站https://apod.nasa.gov/apod/archivepix.html下载图片。这是具体的代码：

def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
    urls.append(result['href'])

我的问题是：每次我运行代码所有图片下载（70,000多）。如何使用findAll将日期范围限制为例如100或日期之间？任何帮助非常感谢。

Answer 1

您可以使用限制参数

results = ...findAll('a', limit=100)

使用美丽的汤搜索日期范围

1 个答案: