邮戳 - 清理已解析的电子邮件

时间:2014-04-26 17:19:28

标签: python json parsing email

我希望我的客户能够通过电子邮件回复。我正在查看传入的电子邮件解析器,例如邮戳,但它们似乎包括电子邮件中的所有嵌套回复和其他标题信息,而不仅仅是新内容。

截至目前,我使用这种方法:

clean_index = text.find('Respond by replying to this message above this line.')
if clean_index != -1 and clean_index > 1:
    new_text = text[:clean_index]
else:
    new_text = text
return new_text

然而,在回复电子邮件时,每个电子邮件客户端似乎都做了不同的事情。例如,当您点击回复时,hotmail会在上一封电子邮件上方添加此标记:

My typed new message......
From: test@hotmail.com
To: q3vxif_e+lj9p@inbound.test.com
Subject: RE: hhj - test
Date: Sat, 26 Apr 2014 16:42:51 +0100
Respond by replying to this message above this line.

这意味着回复中包含所有这些额外的垃圾,而不仅仅是消息本身。

问题 我的问题是,在电子邮件中隔离新邮件时,是否有任何“一刀切”的方法来删除所有其他无用的信息?

2 个答案:

答案 0 :(得分:0)

不幸的是,没有一种适合所有人的方法。主要是因为你指出的问题 - 每个提供者(在这种情况下是MUA)遵循他们自己的格式。

您可以借用处理类似情况的现有开源项目。 Github允许人们通过电子邮件回复问题,他们开源code for the parser

(Gitlab doesn't yet。)

答案 1 :(得分:0)

邮戳应用程序现在支持回复解析。解析的内容位于 StrippedTextReply 属性中。

邮戳文件的限制:

  

StrippedTextReply字段仅限于英文文本回复,而且是   目前在以下电子邮件平台上进行了测试:Yahoo,iCloud,   Gmail,Outlook.com,iOS Mail,Apple Mail,Microsoft Outlook(Windows&   Mac)和Mozilla Thunderbird。邮戳做出了最佳尝试'至   解析所有入站回复。

查看here