我如何读取文件内容(例如:doc文件)?

时间:2018-07-16 14:04:41

标签: python

import subprocess
import os

filename="D:\MAINTRUNK\ar_ctrl_handle_ar_expand_menu.ptu"
r = subprocess.Popen("open " + filename,     stdout=subprocess.PIPE, shell=True, universal_newlines=True)

stdout, stderr = r.communicate()

print stdout

2 个答案:

答案 0 :(得分:1)

它正在提取Word文件的内容。

import docx2txt
text= docx2txt.process("file_name.docx")

答案 1 :(得分:0)

有一个模块可以帮助您阅读.doc文件的内容

import textract
text = textract.process(r"D:\MAINTRUNK\ar_ctrl_handle_ar_expand_menu.doc")

有关更多信息和替代方法,请参见类似问题的答案:Read .doc file with python