应用错误收集

从我的火花代码发送数据到红移

时间：2016-02-25 16:10:13

标签： scala apache-spark amazon-redshift

我在Scala中编写了Spark代码。我的代码读取xml并提取其中的所有信息。目标是将XML中的信息存储到Redshift表中。

是否可以直接从我的Scala Spark代码向Redshift发送数据而不使用S3？

干杯！

2 个答案:

答案 0 :(得分：1)

如果您正在使用Spark SQL，则可以使用spark-xml将XML数据读入DataFrame，然后使用spark-redshift将其写入Redshift表。您还可以查看此question。

答案 1 :(得分：0)

您可以使用预先准备好的SQL语句将行级别插入到Python / Java代码中，但如果要插入多个记录，则效率极低。