我发现 groupby 有一些奇怪的行为,并且缺少值。
df = pd.DataFrame({ "A": [2, 1, 1, 2, 2], "B": [False, np.nan, False, np.nan, False]})
现在计算出我的分组依据:
>>> dfB.groupby('A')['B'].nunique()
A
1 1
2 2
Name: B, dtype: int64
这是熊猫中的虫子吗?默认情况下,我们有 dropna = True 。因此,我认为我们每个人应该有一个条目。
答案 0 :(得分:1)
我认为是错误,可能的解决方法是通过Series.nunique
:
df.orderBy(desc("value")).show(1)
或者:
df.orderBy($"value".desc).show(1)