所以我使用this repo中的int
类来解析Message
文件。我有一个适用于该类的测试文件。
我正在尝试在自定义解析器中使用该类,我正在为我的Django休息框架应用程序编写。
但是当我阅读.msg
时,它还会添加以下内容
stream.body
我怀疑,由于这个额外的内容, ----------------------------488071469102781097692083
Content-Disposition: form-data; name="file"; filename="email_test.msg"
Content-Type: application/vnd.ms-outlook
< actual content here >
----------------------------488071469102781097692083--
类正在抛出以下错误。
Message
我怀疑对吗?我该如何解决这个问题?
答案 0 :(得分:1)
msg-extractor用于MS Outlook中的.msg文件,它们具有二进制格式,称为&#34; OLE2&#34;或者&#34; CFB&#34;。他们从&#34; D0CF&#34;开始当你在十六进制查看器中打开它们时。
您问题中的代码段看起来像是MIME编码的电子邮件,即文本。
您确定要解析的文件是MS Outlook MSG文件吗?