如何使用SQL查询在dbtable中定义表?

时间:2015-09-17 11:00:03

标签: jdbc apache-spark apache-spark-sql

JDBC To Other Databases中,我找到了dbtable参数的以下说明:

  

应该读取的JDBC表。请注意,可以使用在SQL查询的FROM子句中有效的任何内容。例如,您也可以在括号中使用子查询,而不是完整的表。

当我使用代码时:

CREATE TEMPORARY TABLE jdbcTable
USING org.apache.spark.sql.jdbc
OPTIONS (
  url "jdbc:postgresql:dbserver",
  dbtable "mytable"
)

一切都很好,但以下内容:

 dbtable "SELECT * FROM mytable"

导致错误:

enter image description here

有什么问题?

2 个答案:

答案 0 :(得分:14)

由于dbtable用作SELECT语句的源,因此它的格式对普通SQL查询有效。如果要使用子查询,则应在括号中传递查询并提供别名:

CREATE TEMPORARY TABLE jdbcTable
USING org.apache.spark.sql.jdbc
OPTIONS (
    url "jdbc:postgresql:dbserver",
    dbtable "(SELECT * FROM mytable) tmp"
);

它将作为:

传递给数据库
SELECT * FROM (SELECT * FROM mytable) tmp WHERE 1=0

答案 1 :(得分:0)

Scala中的代码

val checkQuery = "(SELECT * FROM " + inputTableName + " ORDER BY " + columnName + " DESC LIMIT 1) AS timetable"

val timeStampDf = spark.read.format("jdbc").option("url", url).option("dbtable", checkQuery).load()

在括号中查询后,还需要添加别名。