Question

我正在尝试从一个列表超过2000张图片的网站上抓取图片。当我调用链接到图像的站点部分时，控制台中仅显示〜1/2的信息，因为打印了太多行。我需要查看已删除的开始信息，并且只想显示一些条目。如何仅显示订单项中2000多个条目的范围（例如1-10）？

我正在使用这个：

containers = page_soup.findAll("div", {"class": "image_list"})
containers[0]

Answer 1

您在这里有各种各样的可能性：

1。在脚本内完成

这将打印前10个容器：

containers = page_soup.findAll("div", {"class": "image_list"})[0:10]
for c in containers:
    print(c)

2。在外壳中完成

您可以打印所有容器，并仅过滤要使用shell命令查看的行。这样一来，您便可以灵活地更改输出，而无需一次又一次地编辑代码。

在您的脚本中，我们将打印所有容器：

containers = page_soup.findAll("div", {"class": "image_list"})
for c in containers:
    print(c)

在外壳中：

这将打印前10行：

python name_of_my_script.py | head

这将打印5至10行：

python name_of_my_script.py | sed -n '5,10p'

这将打印最后10行：

 python name_of_my_script.py | tail

查找手册页以获取更多信息。

Answer 2

使用索引：

这将使容器具有前10个元素（因此您将打印10个元素）。