从存档的Outlook邮件中提取文本

时间:2011-09-14 14:27:02

标签: perl shell outlook

在Outlook文件夹中,我存储了数百条有关电池系统状态的消息。电子邮件每天自动发送。每条消息都包含有关消息正文中电池电压的信息,并且信息的格式始终如下,
日期:2011年9月14日
主电池电压[V]:25.67

我想编写一个例程来从每个消息体中提取电池电压和日期信息并连接结果,这样我得到了[日期,电压]的向量。我希望例程从命令行运行,而不是使用Outlook。什么是这项任务的正确工具?某个特定文件夹中的Outlook邮件是否保存为ASCII文件?如果是这种情况,我可以使用perl或类似工具轻松打开所有文件并将信息拉出来。我只是不知道邮件正文信息的存储方式和位置。

2 个答案:

答案 0 :(得分:2)

首先将您的Outlook邮件存储转换为Maildir或Mbox等标准格式,然后使用Email::FolderMail::Box进行解析。

答案 1 :(得分:1)

如果您想完全绕过Outlook,可以使用IMAP::Client或其他东西直接从服务器获取邮件。根据Outlook的配置方式,现有消息可能存在也可能不存在,但无论如何它都适用于所有新消息。