使用漂亮的汤选择一系列订单项

时间:2018-08-01 01:40:19

标签: python beautifulsoup

我正在尝试从一个列表超过2000张图片的网站上抓取图片。当我调用链接到图像的站点部分时,控制台中仅显示〜1/2的信息,因为打印了太多行。我需要查看已删除的开始信息,并且只想显示一些条目。如何仅显示订单项中2000多个条目的范围(例如1-10)?

我正在使用这个:

containers = page_soup.findAll("div", {"class": "image_list"})
containers[0]

2 个答案:

答案 0 :(得分:2)

您在这里有各种各样的可能性:

1。在脚本内完成

这将打印前10个容器:

containers = page_soup.findAll("div", {"class": "image_list"})[0:10]
for c in containers:
    print(c)

2。在外壳中完成

您可以打印所有容器,并仅过滤要使用shell命令查看的行。这样一来,您便可以灵活地更改输出,而无需一次又一次地编辑代码。

在您的脚本中,我们将打印所有容器:

containers = page_soup.findAll("div", {"class": "image_list"})
for c in containers:
    print(c)

在外壳中:

这将打印前10行:

python name_of_my_script.py | head

这将打印5至10行:

python name_of_my_script.py | sed -n '5,10p'

这将打印最后10行:

 python name_of_my_script.py | tail

查找手册页以获取更多信息。

答案 1 :(得分:0)

使用索引:

2

这将使容器具有前10个元素(因此您将打印10个元素)。