制作一个基本的python scraper ...无法计算如何将我已经制作的模块包含到另一个模块中。获得:"没有模块错误"。这是文件结构:
really_spider.py的代码:
from scrapy.spiders import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy.loader import XPathItemLoader
from scrapy.loader.processors import Join, MapCompose
from ..scraper_app import items
class IndeedSpider(BaseSpider):
name = "indeed"
allowed_domains = ["indeed.com"]
start_urls = ["http://www.indeed.com/jobs?q=security&l="]
deals_list_xpath = '//div[@class="row result"]/td[@class="snip"]'
item_fields = {
'title': '',
'location': '',
'blurb': '',
'pay': '',
'description': ''
}
当我运行python really_spider.py时出现错误...我确信我对python有一些基本的了解,我很遗憾,我对这门语言很陌生。谢谢! :)
答案 0 :(得分:1)
使用Scrapy时,您需要从根文件夹(包含scrapy crawl <spider name>
文件的文件夹)中运行scrapy.cfg
的蜘蛛。
如果您使用scrapy startproject
生成Spider项目,则应该已经有了一个items.py
,可以在其中定义Item
子类。