我正在尝试使用精美的汤从网站https://apod.nasa.gov/apod/archivepix.html下载图片。这是具体的代码:
def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
urls.append(result['href'])
我的问题是:每次我运行代码所有图片下载(70,000多)。如何使用findAll将日期范围限制为例如100或日期之间?任何帮助非常感谢。
答案 0 :(得分:0)
您可以使用限制参数
results = ...findAll('a', limit=100)