Python-如何将文本拆分为段落?

时间:2020-06-19 09:48:21

标签: python web-scraping

我想在抓取文本时将其拆分为多个段落。 我下面的代码提取文本而不分割段落。 有谁知道该怎么做?

这是我的密码。

#extract articles from url
import urllib.request, urllib.error
import requests as req
from bs4 import BeautifulSoup
import csv

num=0
atc={}
for i in range(len(url)):
    res = req.get(url[i]).content
    soup = BeautifulSoup(res, "html.parser")
    elems = soup.find(class_='meteredContent css-1r7ky0e').get_text()
    str=""
    str+=elems
    atc[i]=str

#Dataframeにしてcsv
import csv
import pandas as pd

st=pd.DataFrame(atc,index=['text',])


st.T.to_csv("articles.csv",encoding='utf_8_sig')

这是我从代码中获得的文本数据。 enter image description here

应该有段落。 enter image description here

0 个答案:

没有答案
相关问题