Question

我正在尝试使用Scrapy shell在编写已爬网本身之前浏览网页。有一点我发现很难读取Scrappy shell输出。反正是否有输出漂亮的打印？

例如，使用命令

运行shell

scrapy shell http://www.dmoz.org/Computers/Programming/Languages/Python

然后用shell发出命令：

response.css("ul.directory.dir-col > li > a::attr('href')")

您可以看到输出全部配备在线，难以阅读。 Scrapy shell输出格式是JSON吗？如何使其可读？

Answer 1

或者，您可以使用带有firebug扩展名的firefox在源代码中找到正确的xpath，然后重新格式化并在scrapy shell中尝试。