标签: hive pyspark spark-streaming
我有一个用例
问题是,是否有人使用python从hive中做过火花流?我必须做一个POC,然后做实际的工作。
任何帮助都将受到高度赞赏。
提前致谢!!
答案 0 :(得分:0)
有两种方法可以解决这个问题:
使用spark-streaming从Kinesis中直接获取消息。这会给你一些实时的东西。
一旦文件进入您的临时区域(您的蜂巢仓库或您的某个HDFS位置),您可以使用spark-streaming for文件进行处理。
请告诉我们哪个approch最适合您。