Question

我是Spark / Scala / Hive的新手。我只是想知道调用

之间是否有任何区别

spark = new SparkSession(...).getHiveContext()
spark.sql("SELECR * FROM table")

和

spark = new SparkSession(...).getHiveContext() // not using
spark.read.table(table).select(from("*"))

...

特别是，是否有任何性能差异。

Answer 1

这两个片段具有相同的运行时性能。

第二个API更安全，如果您输入错误或尝试使用某些不受支持的操作，它将为您提供快速而明确的编译错误。你写SELECR而不是SELECT这很有趣，这很好地说明了这一点：）