Question

制作一个基本的python scraper ...无法计算如何将我已经制作的模块包含到另一个模块中。获得：＆＃34;没有模块错误＆＃34;。这是文件结构：

really_spider.py的代码：

from scrapy.spiders import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy.loader import XPathItemLoader
from scrapy.loader.processors import Join, MapCompose
from ..scraper_app import items

class IndeedSpider(BaseSpider):
    name = "indeed"
    allowed_domains = ["indeed.com"]
    start_urls = ["http://www.indeed.com/jobs?q=security&l="]

    deals_list_xpath = '//div[@class="row result"]/td[@class="snip"]'
    item_fields = {
        'title': '',
        'location': '',
        'blurb': '',
        'pay': '',
        'description': ''
    }

当我运行python really_spider.py时出现错误...我确信我对python有一些基本的了解，我很遗憾，我对这门语言很陌生。谢谢！：）

Answer 1

使用Scrapy时，您需要从根文件夹（包含scrapy crawl <spider name>文件的文件夹）中运行scrapy.cfg的蜘蛛。

如果您使用scrapy startproject生成Spider项目，则应该已经有了一个items.py，可以在其中定义Item子类。

Python包含自定义模块

1 个答案: