你好,当我完成对网站的抓取时,我得到了一个csv文件。 但有些行是空的,如:
1,2,3
,,
2,3,5-
所以我正在使用条件没有这条线“,,”
if nom != "" and quantitee != "" and preparation != "":
但它不起作用......
为什么?
这是我的代码
rules = (
Rule(SgmlLinkExtractor(allow=('')), callback='parse_items',follow= True),
)
def parse_items(self, response):
sel = Selector(response)
item = TerItem()
nom = sel.xpath(".//div[@id='fiche_recette_r']//h1/text()").extract()
quantitee = sel.xpath(".//div[@id='fiche_recette_r']//a[@class='inactive']/text()").extract()
preparation = sel.xpath(".//div[@id='fiche_recette_r']//div[@id='recette']//p/text()").extract()
# Si les items ne sont pas vides
if nom != "" and quantitee != "" and preparation != "":
# Nom de la recette
item['nom'] = nom
# Quantitee des ingredients de la recette
item['quantitee'] = quantitee
# La preparation
item['preparation'] = preparation
yield item
感谢您的帮助