Twitter数据与HIVE分析

时间:2012-06-05 09:30:44

标签: hadoop hive

我是Hive和Hadoop的新手,我想创建一个非常简单的演示来分析这样的样本:

T 2009-06-08 21:49:37 你http://twitter.com/blabla 我认为数据挖掘很棒!

T 2009-06-08 21:49:37 你http://twitter.com/blublu 我不这么认为。我不喜欢数据挖掘 .... 一般来说可以这样做吗? 但是我不确切地知道我应该从哪个角度进行策划。你知道做这项工作的任何简单而明确的参考吗?或者你能告诉我(不详细)我该怎么办?

1 个答案:

答案 0 :(得分:1)

简而言之 - 您应该创建自己的SerDe,它将以记录的形式显示推文,然后您可以在hive中将推文作为表格处理。 https://cwiki.apache.org/Hive/developerguide.html#DeveloperGuide-SerDe