我有一个Pandas DataFrame,其中一个Serie包含有序的分类数据。此Serie的某些值可能会丢失(NaN)。我想在不考虑NaN的情况下获得最小值,但是得到了奇怪的结果...
代码:
raw_cat = pd.Categorical(["a", "b", "c", "a"],
categories=["b", "c", "d"],
ordered=True)
s = pd.Series(raw_cat)
raw_cat.min(numeric_only=True), s.min(numeric_only=True)
输出:
('b', nan)
预期输出:
('b', 'b')
我误会什么?谢谢您的帮助。
答案 0 :(得分:0)
此问题是Pandas 0.24.0及更高版本的回归。在Pandas 0.24.2中是正确的。