将项目附加到Scrapy中的JSON数组?

时间:2014-01-28 22:38:54

标签: python arrays json scrapy

我正在使用python框架Scrapy来抓取网站并将数据存储在json数组中。要存储数据,请使用以下命令:

scrapy crawl dmoz -o items.json -t json

每次调用此命令时,它都会在文件中创建一个新的JSON数组。有没有办法简单地附加到文件中已存在的JSON数组?

我意识到Scrapy提供了将项目发送到某种文件格式的导出,但是我一直在努力使其像我运行上述命令一样有效。

1 个答案:

答案 0 :(得分:1)

您可以使用JSON lines format

scrapy crawl dmoz -o items.jsonl -t jsonlines

以便scrapy将项目作为JSON对象的行附加