我试图从网站上搜集前25个标题而不确定为什么这不起作用?它出于某种原因提出了所有的标题。
if section == 'latest':
match=re.compile("<br>(.+?) - <a[^>]+?href='(.+?)'>(.+?)</a>").findall(html)
for i in range(25):
(year, url, name) = match[i]
name = self.CleanTextForSearch(name)
url = self.base_url + url
self.AddContent(list,indexer,common.mode_File_Hosts,name + ' (' + year +')','',type, url=url, name=name, year=year)