我的项目的目的是窥探传入的电子邮件消息,用于会议,约会,时间间隔等。一旦我有特定的内容,我想更新用户的日历。
现在,使用Google Apps脚本可以完成检索邮件和更新日历的基本任务。
我的查询:因为CRF库仅在C ++,Java而非JavaScript中可用。因此,我需要离线访问这些消息。我该怎么做?
PS:任何有关如何推进这一想法的建议都将受到赞赏。
答案 0 :(得分:0)
如果我理解正确,您会遇到分类问题和信息检索问题。 ¹
首先,您想了解传入的邮件是会议/约会还是其他(两类)。这可以通过所谓的朴素贝叶斯过滤来完成。这是一种用于对邮件进行分类的概率方法。它本质上需要一组功能并计算此邮件是会议和不同的概率。它背后的理论基于贝叶斯规则(概率论),因此得名。
然后第二步是在邮件中查找时间。这将是文本挖掘的任务,不幸的是,我还不是很好。因此,我不能告诉你最好的方法,但一个非常简单的方法是:
鉴于您已经知道此邮件是会议邮件,其中应该有一个时间戳。因此,使用正则表达式来记录时间戳并扫描邮件。获取第一个时间戳并将其添加到日历中。不幸的是,这可能会导致一些错误。
我希望我能够给你一个关于你在这里所说的领域的一个小概述。如果您有兴趣,我可以添加更多关于贝叶斯(例如计算)的信息。只需发表评论即可。
¹我不确定是不是真的那样,你还没有回答评论。这也是可能的,你需要一些方法来下载已经分类的邮件...