我如何解析电子邮件文本中“有人写的......”的一部分?

时间:2013-04-14 21:19:46

标签: javascript regex email github filter

如果您收到来自Github的私信,您可以直接通过电子邮件回复,而不是直接回到该网站进行回复。

当Github收到您的电子邮件时,它会解析该邮件并将其插入数据库。我正在尝试做同样的事情。

但是,当我的服务器收到电子邮件作为原始字符串表单时,它会得到如下内容:

Important message here

On April 4, 2012 Somebody wrote:
    > blahblahblah
      On March 2, 2012 Somebody wrote:
           > blahblahbla

当然,我只想要重要的信息。我不想要人们之前写过的其他垃圾。

是否有通用方法来过滤掉它?某种图书馆?

或者......我是否必须检查Gmail,Yahoo,Hotmail以确定他们添加到邮件底部的垃圾邮件然后单独过滤掉它?

Github是如何做到的?

1 个答案:

答案 0 :(得分:2)

GitHub使用他们的email_reply_parser gem。

  

这是GitHub用于显示通过电子邮件回复创建的评论的内容。此代码是开源的,旨在众包我们的电子邮件表示的质量。