标签: outlook text-mining
我正在考虑在一组包含> 4年通信的大型个人.pst文件上执行一些文本挖掘。
最初,我想提取标题信息以识别社交网络,但最终还是希望开始根据关键词对电子邮件进行分类,或者创建一些支持进一步分析的结构化输出。
有没有人有什么建议从哪里开始?
答案 0 :(得分:2)
您应该检查公开提供的研究Enron Email Dataset - >该页面链接到一些有趣的论文