我正在尝试从一个列表超过2000张图片的网站上抓取图片。当我调用链接到图像的站点部分时,控制台中仅显示〜1/2的信息,因为打印了太多行。我需要查看已删除的开始信息,并且只想显示一些条目。如何仅显示订单项中2000多个条目的范围(例如1-10)?
我正在使用这个:
containers = page_soup.findAll("div", {"class": "image_list"})
containers[0]
答案 0 :(得分:2)
您在这里有各种各样的可能性:
1。在脚本内完成
这将打印前10个容器:
containers = page_soup.findAll("div", {"class": "image_list"})[0:10]
for c in containers:
print(c)
2。在外壳中完成
您可以打印所有容器,并仅过滤要使用shell命令查看的行。这样一来,您便可以灵活地更改输出,而无需一次又一次地编辑代码。
在您的脚本中,我们将打印所有容器:
containers = page_soup.findAll("div", {"class": "image_list"})
for c in containers:
print(c)
在外壳中:
这将打印前10行:
python name_of_my_script.py | head
这将打印5至10行:
python name_of_my_script.py | sed -n '5,10p'
这将打印最后10行:
python name_of_my_script.py | tail
查找手册页以获取更多信息。
答案 1 :(得分:0)
使用索引:
2
这将使容器具有前10个元素(因此您将打印10个元素)。