比较pandas.Series在不同的顺序时是否相等

时间:2014-04-10 09:07:45

标签: python pandas

在应用二元运算符(如加法和减法)之前,Pandas会自动对齐Series对象的数据索引,但在检查相等性时不会这样做。为什么会这样,我该如何克服它?

考虑以下示例:

In [15]: x = pd.Series(index=["A", "B", "C"], data=[1,2,3])

In [16]: y = pd.Series(index=["C", "B", "A"], data=[3,2,1])

In [17]: x
Out[17]:
A    1
B    2
C    3
dtype: int64

In [18]: y
Out[18]:
C    3
B    2
A    1
dtype: int64

In [19]: x==y
Out[19]:
A    False
B     True
C    False
dtype: bool

In [20]: x-y
Out[20]:
A    0
B    0
C    0
dtype: int64

我正在使用pandas 0.12.0。

1 个答案:

答案 0 :(得分:5)

你可以用以下方法克服它:

In [5]: x == y.reindex(x.index)
Out[5]: 
A    True
B    True
C    True
dtype: bool

In [6]: x.sort_index() == y.sort_index()
Out[6]: 
A    True
B    True
C    True
dtype: bool

这里解释'为什么':https://github.com/pydata/pandas/issues/1134#issuecomment-5347816

更新:存在一个问题,即(https://github.com/pydata/pandas/issues/1134)和PR来解决此问题(https://github.com/pydata/pandas/pull/6860