Hadoop中的电子邮件提取

时间:2016-04-01 02:35:06

标签: java hadoop mapreduce hbase

我们使用Java代码将传入的电子邮件存储到hadoop中(由其他团队编写)。他们正在将错误投入生产,其中,让我们说,“去”。字段未显示在HBase中(用于搜索电子邮件等)。作为支持团队的一员,我修改了java代码以接受' bcc'针对转发电子邮件的字段,但现在他们想要修复现有电子邮件的问题,其中包括' bcc'田野不见了。

开发人员让我写一个Map Reduce Job来修复这个错误,但我对编写这些工作知之甚少......我可以学习它但在继续前进之前我想知道这是解决这个问题的唯一选择问题或者我可以使用其他工具来解决学习曲线较小的问题吗?

0 个答案:

没有答案