我目前正在使用模块textract(使用msg-extractor)从msg文件中获取所有文本内容。但是我得到一些文件的编码错误,这些文件似乎与textract的开放问题有关(based on the link)
我可以使用其他模块从msg文件中提取文本吗?我使用Python 3.6进行开发
答案 0 :(得分:0)
您可以使用extract_msg模块从.MSG文件以及正文中提取元数据。
import extract_msg
with extract_msg.Message(filepath) as msg:
msg_body = msg.body
msg_subject = msg.subject
print(msg_body)