HTML代码在下面,由于类不同,我无法提取数据; 仅将td.fonce类数据提取到文件中,而不提取td.clair。
import scrapy
class QuotesSpider(scrapy.Spider):
name = "vxvault"
start_urls = [
'http://vxvault.net/ViriList.php?s=0&m=40',
]
def parse(self, response):
for fonce in response.css('td.fonce'):
if fonce is not None:
yield {
'URL': fonce.css('a::text').extract_first(),
#'MD5': fonce.css('a::text')[2].extract(),
#'IP': fonce.css('a::text')[3].extract(),
}
for clair in response.css('td.clair'):
if clair is not None:
yield {
'URL': clair.css('a::text').extract(),
}