使用python将文件夹中的所有word文档转换为txt

时间:2019-08-09 16:36:26

标签: python ms-word

我正在尝试将Word文档转换为txt。更改扩展名无效。我需要用单词打开它,然后将其保存为.txt格式 我正在从这里http://code.activestate.com/recipes/279003-converting-word-documents-to-text/

使用代码
<project name="FirstAntProject">
<target name="compile">
    <echo>Compiling..</echo>
    <javac includeantruntime="false" srcdir="P:\Composemail\mailtest" destdir="P:\Composemail\mailtest" />
</target>
<target name="run" depends="compile">
    <echo>Running..</echo>
    <java classname="Executemail">
        <classpath path="P:\Composemail\classes"/> 
    </java>
</target>

但是,当我运行它时,第一个文件可以正常运行,但是在第二个文件上却显示错误

这是错误消息

import fnmatch, os, pythoncom, sys, win32com.client

wordapp = win32com.client.gencache.EnsureDispatch("Word.Application")

try:
    for path, dirs, files in os.walk(sys.argv[1]):
        for doc in [os.path.abspath(os.path.join(path, filename)) for filename in files if fnmatch.fnmatch(filename, '*.doc')]:
            print "processing %s" % doc
            wordapp.Documents.Open(doc)
            docastxt = doc.rstrip('doc') + 'txt'
            wordapp.ActiveDocument.SaveAs(docastxt, FileFormat=win32com.client.constants.wdFormatTextLineBreaks)
            wordapp.ActiveWindow.Close()
finally:
    wordapp.Quit()


我尝试只在目录中放一个word文件,它工作正常。但是一旦我在那里有2个文件。该过程将对2ed文件失败(如果该文件是文件夹中的唯一文件,则两个文件都将成功转换)

能否让我知道此错误消息的含义?以及如何解决它。

0 个答案:

没有答案