Apache flume使用我当前的配置获取前几年或几个月的推文。我想要获取当前的推文。我怎么能这样做?
答案 0 :(得分:0)
检查这个github项目,使用Streaming API分析hadoop中的实时推文。
https://github.com/cloudera/cdh-twitter-example
此页面还包括如何设置水槽,蜂巢和水箱。 Oozie的。
您必须安装oozie和hive:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/4.2.0/CDH4-Installation-Guide/CDH4-Installation-Guide.html
答案 1 :(得分:0)
请参阅以下链接以获取有关hdfs的流媒体推文:
http://www.thecloudavenue.com/2013/03/analyse-tweets-using-flume-hadoop-and.html