我试图让它与Scrapy一起工作,这真的令人沮丧。我无法导入items.py文件。我已经尝试了所有方法,包括添加NSOLID_APPNAME
并使用不同的名称摧毁和重新创建项目和蜘蛛几次。
from__future__ import absolute import
但我仍然得到:
from __future__ import absolute_import
import scrapy
from kano.items import KanoItem
class KatscrapSpider(scrapy.Spider):
name = "katscrap"
allowed_domains = ["kat.cr"]
start_urls = (
'https://kat.cr/usearch/category%3Amusic/2/?field=seeders&sorder=desc',
)
def parse(self, response):
self.log("link: %s" % response.xpath(
'//*[@id][starts-with(@id,"torrent")]/td[1]/div[1]/a[4]//@href').extract())
item['torrent_url'] = response.xpath(
'//*[@id][starts-with(@id,"torrent")]/td[1]/div[1]/a[4]//@href').extract()
这似乎是scrapy的一种常见错误,有人可以解释为什么会这样吗?
编辑:
这是我的树形结构:
ImportError: No module named kano.items
答案 0 :(得分:0)
在运行蜘蛛时使用scrapy crawl katscrap
代替python kat.py
。发生这种情况是因为当您调用命令python kat.py
时,它会搜索当前目录中的kano
模块而不是上一个目录。