变量不是Spark中的绑定值

时间:2016-10-27 06:18:28

标签: scala apache-spark apache-spark-sql

我传递变量,但它没有传递值。

我在这里填充变量值。

val Temp = sqlContext.read.parquet("Tabl1.parquet")
Temp.registerTempTable("temp")

val year = sqlContext.sql("""select value  from Temp where name="YEAR"""")
year.show()

这里year.show()适当的值。

我在下面的代码中传递参数。

val data = sqlContext.sql("""select count(*) from Table where Year='$year' limit 10""")
data.show()

1 个答案:

答案 0 :(得分:1)

yearDataframe,而不是特定值(IntLong)。因此,当您在字符串插值中使用它时,您将得到Dataframe.toString的结果,这不是您可以用来比较值的东西(toString返回Dataframe模式的字符串表示)。

如果您认为year Dataframe的行包含Int类型的单个,并且您希望获得该列的值 - 您可以使用first().getAs[Int](0)获取该值,然后使用它来构建您的下一个查询:

val year: DataFrame = sqlContext.sql("""select value from Temp where name="YEAR"""")
// get the first column of the first row:
val actualYear: Int = year.first().getAs[Int](0) 

val data = sqlContext.sql(s"select count(*) from Table where Year='$actualYear' limit 10")

如果value表中的Temp列的类型不同(StringLong) - 只需将Int替换为该类型。