Spark结构化流Kinesis数据源

时间:2018-08-26 11:13:19

标签: apache-spark spark-structured-streaming

是否可以将Kinesis流用作Spark结构化流的数据源?我找不到任何可用的连接器。

1 个答案:

答案 0 :(得分:2)

Qubole为此提供了一个kinesis-sql库。

https://github.com/qubole/kinesis-sql

然后,您可以使用与其他任何Spark结构化流媒体源相似的源:

val source = spark
   .readStream
   .format("kinesis")
   .option("streamName", "spark-source-stream")
   .option("endpointUrl", "https://kinesis.us-east-1.amazonaws.com")
   .option("awsAccessKeyId", [YOUR_AWS_ACCESS_KEY_ID])
   .option("awsSecretKey", [YOUR_AWS_SECRET_KEY])
   .option("startingPosition", "TRIM_HORIZON")
   .load