如何将每个段落从.docx文件复制到.csv文件中的新行?

时间:2019-04-29 18:38:04

标签: python docx python-docx

我是python的新手。我正在尝试解析.docx文件,并将每个段落复制到新.csv文件中的单独行中。

我能够准确地计算段落数,并打印整个文档,但是在尝试遍历文档以解析每个段落时遇到错误。

1 个答案:

答案 0 :(得分:1)

因此,您可以从安装名为“ docx”的软件包开始(如果您具有python2或在python3中具有“ pip install python-docx”,请在终端或命令行上执行“ pip install docx”)。

然后您可以运行以下代码:

from docx import Document
import pandas as pd

document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
    print(para.text)
    df.loc[len(df)] = para.text
print(df)

我希望它会有所帮助。 BR