elasticsearch - 如何使用Spark Streaming从HDFS读取文件并将其保存到ElasticSearch - Thinbug

如何使用Spark Streaming从HDFS读取文件并将其保存到ElasticSearch

时间：2018-07-30 19:41:57

标签： elasticsearch pyspark hdfs jupyter-notebook spark-streaming

有没有办法使用Spark Streaming从HDFS（例如JSON）读取文件，然后将其保存到elasticsearch？

我能够读取JSON文件，创建pyspark数据框，然后将其保存到elasticsearch中的索引中，但是是否可以使用Spark Streaming做到这一点？我希望每个保存到HDFS的文件也保存在elasticsearch中。

我正在使用Jupyter Notebook，ElasticSearch 6.3.0和带有Python的spark 2.3.0

预先感谢

0 个答案:

没有答案