在python中搜索docx文件

时间:2014-04-02 18:26:55

标签: python module docx

我正在尝试使用python-docx模块搜索docx文件中的特定字符串:

https://github.com/python-openxml/python-docx

但由于某些原因,我尝试在模块中使用的所有函数似乎都没有工作(opendocx,search等)。我已经安装了模块并将其导入我的脚本中,这样我就无法弄清楚出了什么问题。例如,当我尝试使用opendocx()时,我得到一个错误,说该模块没有属性' opendocx'

其他人似乎能够很好地使用这个模块,我错过了一些明显的东西吗?

编辑:

以下是我尝试使用doc的代码:

def parseFile2(filename):
    document = opendocx(filename)
    for key in SEARCH_STRINGS:
        if search(document, key):
            return True

文件名从另一个带有完整路径的函数传入,而我得到的错误是模块没有属性opendocx

2 个答案:

答案 0 :(得分:0)

您可能正在import modulename而不是from modulename import class。这往往会导致您看到的行为。例如:

>>> import math
>>> sqrt(64)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'sqrt' is not defined
>>> from math import sqrt
>>> sqrt(64)
8.0

答案 1 :(得分:0)

快速查看模块文档后,您不使用模块的Document类。

from docx import Document

def parseFile2(filename):
    document = Document(filename)
    for key in SEARCH_STRINGS:
        if search(document, key): # dont know if this part works, cause i didn't install the module
            return True