Panda DataFrames中排序的分类数据的最小值

时间:2019-02-07 10:50:12

标签: python pandas categorical-data

我有一个Pandas DataFrame,其中一个Serie包含有序的分类数据。此Serie的某些值可能会丢失(NaN)。我想在不考虑NaN的情况下获得最小值,但是得到了奇怪的结果...

代码:

raw_cat = pd.Categorical(["a", "b", "c", "a"],
                         categories=["b", "c", "d"],
                         ordered=True)
s = pd.Series(raw_cat)
raw_cat.min(numeric_only=True), s.min(numeric_only=True)

输出:

('b', nan)

预期输出:

('b', 'b')

我误会什么?谢谢您的帮助。

1 个答案:

答案 0 :(得分:0)

此问题是Pandas 0.24.0及更高版本的回归。在Pandas 0.24.2中是正确的。

https://github.com/pandas-dev/pandas/issues/25299