如何输出不在groupBy和Aggregation列中的更多相关列

时间:2018-08-07 15:00:37

标签: scala apache-spark apache-spark-sql

我是Spark的新手,遇到了这个简单的问题。 我有一个这样的数据框:

scala> testDF.show
+-------+---+-----+
|country| id|price|
+-------+---+-----+
|    USA|  1|  100|
|    USA|  2|  110|
|  CHINA|  3|  105|
|  CHINA|  4|  102|
+-------+---+-----+

我想要的是输出中每个国家/地区最便宜的价格以及相应的ID。预期输出应为:

+-------+---+----------+
|country| id| minPrice |
+-------+---+----------+
|  CHINA|  4|       102|
|    USA|  1|       100|
+-------+---+----------+

我该怎么做?谢谢。

0 个答案:

没有答案