代码不会使用BeautifulSoup在网站上显示所有剥离的提取文本

时间:2019-01-20 19:52:36

标签: python beautifulsoup

Python的新手。以下代码仅允许我显示提取的网站中的单个p条目(第一个条目为0,为当前示例)。

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = "https://en.wikipedia.org/wiki/Young_Thug"

uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()

page_soup = soup(page_html, "html.parser")
page_soup.findAll("p")

paragraphs = page_soup.findAll("p")
paragraph = paragraphs[0].text.strip()

print(paragraph)

由于某种原因,我无法理解特定的 for 参数,因此我需要以单个文本块显示网站上的所有p元素。

以上代码段的最终目标是阅读年级应用程序,因此是精简的文本。任何帮助,将不胜感激,谢谢!

1 个答案:

答案 0 :(得分:1)

我不在便携式计算机上,无法包含输出,但通常是:

  messages = [
    {
      name: user1,
      messages: [
        {
          user2: [message1, message2]
        }
      ]
    },
    {
      name: user2,
      messages: [
        {
          user1: [message1, message2]
        }
      ]
    }
  ]