批量与docx

时间:2017-05-22 14:01:12

标签: python-docx

我正在尝试写几行来在单个文件夹中的几个docx文件的段落中查找字符串。我已经设法在文件夹中逐个打开docx但尚未找到并打印包含特定字符串的段落,任何提示都非常受欢迎。

import docx
import glob
from docx import Document
for document in glob.iglob("*.docx"):
 document=Document()
 for paragraph in document.paragraphs:
  if 'String' in paragraph.text:
   print paragraph.text
  else:
   print ('not found')

1 个答案:

答案 0 :(得分:0)

我认为您将文件名与python-pptx Document对象混淆。

你需要的是这样的东西:

import glob
from docx import Document

for filename in glob.iglob('*.docx'):
    document = Document(filename)
    for paragraph in document.paragraphs:
        if 'String' in paragraph.text:
            print paragraph.text
        else:
            print 'not found'