标签: python arrays json scrapy
我正在使用python框架Scrapy来抓取网站并将数据存储在json数组中。要存储数据,请使用以下命令:
scrapy crawl dmoz -o items.json -t json
每次调用此命令时,它都会在文件中创建一个新的JSON数组。有没有办法简单地附加到文件中已存在的JSON数组?
我意识到Scrapy提供了将项目发送到某种文件格式的导出,但是我一直在努力使其像我运行上述命令一样有效。
答案 0 :(得分:1)
您可以使用JSON lines format
scrapy crawl dmoz -o items.jsonl -t jsonlines
以便scrapy将项目作为JSON对象的行附加