bigdata:如何分析pst / email数据?

时间:2015-07-03 17:01:55

标签: hadoop mapreduce bigdata apache-tika pst

我在hdfs中有pst或email文件。 现在,我想通过hadoop中最适合的组件进行文本分析。 我该如何开始。

我是否必须首先从这些文件中提取实际内容并将其存储在某处(例如在文本文件中),然后在文本文件上运行分析?

请建议我。

p.s:当我开始在谷歌搜索时,我遇到this。是剩下的唯一选择还是任何其他解决方案。

0 个答案:

没有答案