Pyspark在列X中获得值,其中列Y最小化,按列Z分组

时间:2018-01-19 22:00:48

标签: apache-spark pyspark

我有一个数据框

X | Y | Z
=========
A 1 key_1
B 2 key_1
C 3 key_1
Q 2 key_2
Z 7 key_2

我想把它变成

Z | X
======
key_1 | A
key_2 | Q

因为X的值是Z的值Ydictionary-comprehension最小化。

我有一种感觉,我需要一个窗口功能或其他东西,但不知道该怎么做

0 个答案:

没有答案