在JDBC To Other Databases中,我找到了dbtable
参数的以下说明:
应该读取的JDBC表。请注意,可以使用在SQL查询的FROM子句中有效的任何内容。例如,您也可以在括号中使用子查询,而不是完整的表。
当我使用代码时:
CREATE TEMPORARY TABLE jdbcTable
USING org.apache.spark.sql.jdbc
OPTIONS (
url "jdbc:postgresql:dbserver",
dbtable "mytable"
)
一切都很好,但以下内容:
dbtable "SELECT * FROM mytable"
导致错误:
有什么问题?
答案 0 :(得分:14)
由于dbtable
用作SELECT
语句的源,因此它的格式对普通SQL查询有效。如果要使用子查询,则应在括号中传递查询并提供别名:
CREATE TEMPORARY TABLE jdbcTable
USING org.apache.spark.sql.jdbc
OPTIONS (
url "jdbc:postgresql:dbserver",
dbtable "(SELECT * FROM mytable) tmp"
);
它将作为:
传递给数据库SELECT * FROM (SELECT * FROM mytable) tmp WHERE 1=0
答案 1 :(得分:0)
Scala中的代码
val checkQuery = "(SELECT * FROM " + inputTableName + " ORDER BY " + columnName + " DESC LIMIT 1) AS timetable"
val timeStampDf = spark.read.format("jdbc").option("url", url).option("dbtable", checkQuery).load()
在括号中查询后,还需要添加别名。