使用json上的Hadoop或从Web提取的非结构化数据进行文本分析和统计分析

时间:2017-10-26 05:38:06

标签: hadoop sentiment-analysis text-analysis flume-ng

我正在从网络中提取数据,将其转换为json形式,然后使用apache flume将其存储到hadoop fs中。因此,当在hadoop上存储数据时,flume会生成我们的文件。现在我想随机访问这些数据,以便进行文本分析或统计分析。什么是最佳方式?

0 个答案:

没有答案