Question

Python的新手。以下代码仅允许我显示提取的网站中的单个p条目（第一个条目为0，为当前示例）。

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = "https://en.wikipedia.org/wiki/Young_Thug"

uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()

page_soup = soup(page_html, "html.parser")
page_soup.findAll("p")

paragraphs = page_soup.findAll("p")
paragraph = paragraphs[0].text.strip()

print(paragraph)

由于某种原因，我无法理解特定的 for 参数，因此我需要以单个文本块显示网站上的所有p元素。

以上代码段的最终目标是阅读年级应用程序，因此是精简的文本。任何帮助，将不胜感激，谢谢！

Answer 1

我不在便携式计算机上，无法包含输出，但通常是：

  messages = [
    {
      name: user1,
      messages: [
        {
          user2: [message1, message2]
        }
      ]
    },
    {
      name: user2,
      messages: [
        {
          user1: [message1, message2]
        }
      ]
    }
  ]

代码不会使用BeautifulSoup在网站上显示所有剥离的提取文本

1 个答案: