我是python的新手。我正在尝试解析.docx文件,并将每个段落复制到新.csv文件中的单独行中。
我能够准确地计算段落数,并打印整个文档,但是在尝试遍历文档以解析每个段落时遇到错误。
答案 0 :(得分:1)
因此,您可以从安装名为“ docx”的软件包开始(如果您具有python2或在python3中具有“ pip install python-docx”,请在终端或命令行上执行“ pip install docx”)。
然后您可以运行以下代码:
from docx import Document
import pandas as pd
document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
print(para.text)
df.loc[len(df)] = para.text
print(df)
我希望它会有所帮助。 BR