我正在抓取一个网站,该网站上有一个班级内的段落列表。 当我打印段落中的文字时,一切都很好。但是,如果我要将它们存储到列表中,则会收到“无”的消息。
要遍历所有这些段落,我使用带循环的find_all方法。我该如何继续接收真实文本,字符串并将其存储到列表中。
listagoala = []
col_moneda = container_fluid.find('div', class_='col-sm-2 hidden-xs')
moneda = col_moneda.find_all('p')
for paragraphs in moneda:
listaplina = listagoala.append(paragraphs.text)
print(listaplina)
输出:
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
答案 0 :(得分:3)
读者注意事项:此答案是指问题的原始版本,其中包含以下行:listaplina = [paragraphs.text].extend(listagoala)
。
list.extend()
不返回修改后的列表。它返回None
(已在适当位置修改了列表)。
听起来您正在寻找以下内容:
listaplina = [paragraphs.text] + listagoala
答案 1 :(得分:1)
为什么不简单地做
listagoala = []
col_moneda = container_fluid.find('div', class_='col-sm-2 hidden-xs')
moneda = col_moneda.find_all('p')
for paragraphs in moneda:
listagoala.append(paragraphs.text)
print(listagoala) # Using print here will print multiple lists, as this is inside loop
print(listagoala) # print the final list with all elements
您不必做
listaplina = listagoala.append(paragraphs.text)
listagoala.append(paragraphs.text)
将起作用。
仅供您解释:
>>> a = [1,2,3,4]
>>> b = [5,6,7,8]
>>> a.extend(b)
>>> a
[1, 2, 3, 4, 5, 6, 7, 8]
>>>