使用python docx查找文档的长度

时间:2018-08-16 12:21:03

标签: python python-docx

我正在尝试从Word文档的第一行到最后一行循环。我正在使用python-docx包。 文档也处理段落和表格。 我想做的是:从文档的第一个到最后编写一个for循环,然后对段落和表进行一些操作

如何遍历python中的每一行?

2 个答案:

答案 0 :(得分:0)

将文件路径传递给以下功能:

import docx

def getText(filepath):
    doc = docx.Document(filepath)
    fullText = []
    for para in doc.paragraphs:
        fullText.append(para.text)
    return '\n'.join(fullText)

它将返回行列表。 (此处的行可能与您在文档中看到的行不同)

然后您可以使用以下方法进行迭代:

for paragraph in getText(filepath).split('\n'):
    # do what you will with the line

答案 1 :(得分:0)

类似的方法会有所帮助:

import docx
doc = docx.Document('your file')
for i in doc.paragraphs:
     do something