我在Microsoft Outlook中收到一封包含html表的邮件。我想将其解析为pandas数据帧。
我已经编写了一个脚本,它使用漂亮的汤来解析数据帧中的html文本。但我首先要努力阅读html中的电子邮件。
找到消息后我使用下面的代码将其读入文本文件。但它正在将文本写成一个/ n分隔的字符串,而不是像我期望的那样的数据。这意味着我无法使用美丽的汤将其传入数据帧。
我找到了很多关于如何编写和发送html邮件的例子,但没有找到如何以html格式阅读的例子。有什么想法吗?
contents = msg.Body.encode('ascii', 'ignore').decode('ascii')
contents_file = open("U:\body.txt", "w")
contents_file.write(contents)
contents_file.close()
答案 0 :(得分:3)
自己找到答案。我应该使用msg.HTMLBody而不是msg.Body