通过python解析outlook * .msg电子邮件中的表

时间:2018-05-30 10:09:44

标签: python pandas html-table outlook html-email

我正在尝试使用python和Pandas阅读outlook * .msg。我使用名为“ExtractMsg”的模块获取了电子邮件的正文。电子邮件包含一个非常复杂的表格,因为即使在某些单元格中也有新的硬线('\ r \ n')。这使得转换为Pandas非常难以预测。我想知道如何在熊猫中重现相同的表格。非常感谢!

如何附上电子邮件:电子邮件截图

enter image description here

我的代码在这里:

import ExtractMsg
email = ExtractMsg.Message(file)
email_body = email.body

电子邮件正文如下:

'\ r \ n \ n \ r \ nB \ r \ n \ n \ r \ n1 \ r \ n1a \ r \ n1b \ r \ nss \ r \ n1c \ r \ n2 \ r \ n \ n \ n \ n \ n \ r \ n \ n \ n \ n \ n \ N2C \ r \ N3 \ r \ N3A \ r \ N3B \ r \器n3c \ r \ nxxx \ r \ N4 \ r \ N4A \ r \ N4B \ r \ N4C \ r \ N5 \ r \ N5A \ r \ nttt \ r \ n5b \ r \ n5c \ r \ n \ r \ n'

0 个答案:

没有答案