从我的火花代码发送数据到红移

时间:2016-02-25 16:10:13

标签: scala apache-spark amazon-redshift

我在Scala中编写了Spark代码。我的代码读取xml并提取其中的所有信息。目标是将XML中的信息存储到Redshift表中。

是否可以直接从我的Scala Spark代码向Redshift发送数据而不使用S3?

干杯!

2 个答案:

答案 0 :(得分:1)

如果您正在使用Spark SQL,则可以使用spark-xml将XML数据读入DataFrame,然后使用spark-redshift将其写入Redshift表。 您还可以查看此question

答案 1 :(得分:0)

您可以使用预先准备好的SQL语句将行级别插入到Python / Java代码中,但如果要插入多个记录,则效率极低。