Question

我正在学习Scrapy 我想使用Scrapy查找已爬网页的大小或响应大小（KB或MB等）我可以使用response.body找出已抓取网页的内容长度找出每个request下载了多少数据的最简单方法是什么？

我试图理解this solution，这与我的要求相似。但我无法理解这段代码。

parse(self, response):
    url=response.url
    content=response.body
    #download_size=

Answer 1

您可以使用通过阅读Response Object的headers属性中的content-length提供的信息来获取大小。

parse(self, response):
    url=response.url
    content=response.body
    #response length in bytes
    download_size= int(response.headers['content-length'])

Answer 2

您可以简单地使用内置的response.body并将len应用于它。只需

size=str(len(response.body)),

如何在Scrapy中找出已抓取网页的大小？

2 个答案: