应用错误收集

使用json上的Hadoop或从Web提取的非结构化数据进行文本分析和统计分析

时间：2017-10-26 05:38:06

标签： hadoop sentiment-analysis text-analysis flume-ng

我正在从网络中提取数据，将其转换为json形式，然后使用apache flume将其存储到hadoop fs中。因此，当在hadoop上存储数据时，flume会生成我们的文件。现在我想随机访问这些数据，以便进行文本分析或统计分析。什么是最佳方式？

0 个答案:

没有答案