Question

我正在抓取一个网站，该网站上有一个班级内的段落列表。当我打印段落中的文字时，一切都很好。但是，如果我要将它们存储到列表中，则会收到“无”的消息。

要遍历所有这些段落，我使用带循环的find_all方法。我该如何继续接收真实文本，字符串并将其存储到列表中。

listagoala = []

col_moneda = container_fluid.find('div', class_='col-sm-2 hidden-xs')

moneda = col_moneda.find_all('p')

for paragraphs in moneda:
    listaplina = listagoala.append(paragraphs.text)
    print(listaplina)

输出：

None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None

Answer 1

读者注意事项：此答案是指问题的原始版本，其中包含以下行：listaplina = [paragraphs.text].extend(listagoala)。

list.extend()不返回修改后的列表。它返回None（已在适当位置修改了列表）。

听起来您正在寻找以下内容：

listaplina = [paragraphs.text] + listagoala

Answer 2

为什么不简单地做

listagoala = []

col_moneda = container_fluid.find('div', class_='col-sm-2 hidden-xs')

moneda = col_moneda.find_all('p')

for paragraphs in moneda:
    listagoala.append(paragraphs.text)
    print(listagoala) # Using print here will print multiple lists, as this is inside loop

print(listagoala) # print the final list with all elements

您不必做

listaplina = listagoala.append(paragraphs.text)

listagoala.append(paragraphs.text)将起作用。

仅供您解释：

>>> a = [1,2,3,4]
>>> b = [5,6,7,8]
>>> a.extend(b)
>>> a
[1, 2, 3, 4, 5, 6, 7, 8]
>>>

为什么我会收到完整的“无”印刷品？

2 个答案: