我正在尝试使用Scrapy shell在编写已爬网本身之前浏览网页。有一点我发现很难读取Scrappy shell输出。反正是否有输出漂亮的打印?
例如,使用命令
运行shellscrapy shell http://www.dmoz.org/Computers/Programming/Languages/Python
然后用shell发出命令:
response.css("ul.directory.dir-col > li > a::attr('href')")
您可以看到输出全部配备在线,难以阅读。 Scrapy shell输出格式是JSON吗?如何使其可读?
答案 0 :(得分:0)
或者,您可以使用带有firebug扩展名的firefox在源代码中找到正确的xpath,然后重新格式化并在scrapy shell中尝试。