我正在尝试写几行来在单个文件夹中的几个docx文件的段落中查找字符串。我已经设法在文件夹中逐个打开docx但尚未找到并打印包含特定字符串的段落,任何提示都非常受欢迎。
import docx
import glob
from docx import Document
for document in glob.iglob("*.docx"):
document=Document()
for paragraph in document.paragraphs:
if 'String' in paragraph.text:
print paragraph.text
else:
print ('not found')
答案 0 :(得分:0)
我认为您将文件名与python-pptx
Document
对象混淆。
你需要的是这样的东西:
import glob
from docx import Document
for filename in glob.iglob('*.docx'):
document = Document(filename)
for paragraph in document.paragraphs:
if 'String' in paragraph.text:
print paragraph.text
else:
print 'not found'