将脚本生成的数据移至Kafka主题,然后移至HDFS

时间:2018-12-26 13:48:59

标签: unix hive apache-kafka

我有一个脚本来获取特定Kafka主题中的邮件计数,并且只能在Kafka托管服务器中执行。脚本的输出必须移至Hive / HDFS。那么我可以将其移至Kafka主题,然后使用HDFS Sink连接器将其移至HDFS吗?如果是,如何将脚本生成的数据移至Kafka主题?还请告诉我是否有更好的解决方案。

1 个答案:

答案 0 :(得分:0)

  

如何将脚本生成的数据移至Kafka主题

您可以将命令的输出传递给Kafka主题

your_script.sh | kafka-console-producer --topic foo --broker-list xx:9092 

或者您可以使用具有Kafka客户端的某种语言来重写脚本。例如Python


或者,您可以研究设置Apache Nifi,然后在其中运行脚本并将结果上传到HDFS / Hive。


如果您想要Kafka + Hive集成,Hortonworks刚刚宣布了Hive-Kafka