如何使用Spark Streaming从HDFS读取文件并将其保存到ElasticSearch

时间:2018-07-30 19:41:57

标签: elasticsearch pyspark hdfs jupyter-notebook spark-streaming

有没有办法使用Spark Streaming从HDFS(例如JSON)读取文件,然后将其保存到elasticsearch?

我能够读取JSON文件,创建pyspark数据框,然后将其保存到elasticsearch中的索引中,但是是否可以使用Spark Streaming做到这一点?我希望每个保存到HDFS的文件也保存在elasticsearch中。

我正在使用Jupyter Notebook,ElasticSearch 6.3.0和带有Python的spark 2.3.0

预先感谢

0 个答案:

没有答案