文本挖掘Outlook电子邮件存档

时间:2011-01-31 14:59:57

标签: outlook text-mining

我正在考虑在一组包含> 4年通信的大型个人.pst文件上执行一些文本挖掘。

最初,我想提取标题信息以识别社交网络,但最终还是希望开始根据关键词对电子邮件进行分类,或者创建一些支持进一步分析的结构化输出。

有没有人有什么建议从哪里开始?

1 个答案:

答案 0 :(得分:2)

您应该检查公开提供的研究Enron Email Dataset - >该页面链接到一些有趣的论文