Python包含自定义模块

时间:2016-09-01 20:05:49

标签: python module scrapy scrapy-spider

制作一个基本的python scraper ...无法计算如何将我已经制作的模块包含到另一个模块中。获得:"没有模块错误"。这是文件结构:enter image description here

really_spider.py的代码:

from scrapy.spiders import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy.loader import XPathItemLoader
from scrapy.loader.processors import Join, MapCompose
from ..scraper_app import items

class IndeedSpider(BaseSpider):
    name = "indeed"
    allowed_domains = ["indeed.com"]
    start_urls = ["http://www.indeed.com/jobs?q=security&l="]

    deals_list_xpath = '//div[@class="row result"]/td[@class="snip"]'
    item_fields = {
        'title': '',
        'location': '',
        'blurb': '',
        'pay': '',
        'description': ''
    }

当我运行python really_spider.py时出现错误...我确信我对python有一些基本的了解,我很遗憾,我对这门语言很陌生。谢谢! :)

1 个答案:

答案 0 :(得分:1)

使用Scrapy时,您需要从根文件夹(包含scrapy crawl <spider name>文件的文件夹)中运行scrapy.cfg的蜘蛛。

如果您使用scrapy startproject生成Spider项目,则应该已经有了一个items.py,可以在其中定义Item子类。