比较Python

时间:2017-06-01 00:34:50

标签: python list numpy indexing

我有一个大型数据集试图用Pandas阅读。我试图将其中一个列的值分成两部分,并检查这些集之间是否存在重叠值。使用下面的代码,结果是数组中有一些值重叠' b'和阵列'。我想具体了解这些价值但不知道怎么做?任何人都可以指出我正确的方向吗?

df = pd.read_csv('....csv')

df2 = df[df['Freq']>= 280]
a=df2['Ring'].values
b=df2['Ring'].drop_duplicates().values

df3 = df[df['Freq']<= 280]
df3['Ring'].values
c=df3['Ring'].drop_duplicates().values

if np.all(b) == np.all(c):
    print ("They are overlapping")
else:   
    print ("They are not overlapping")

1 个答案:

答案 0 :(得分:0)

根据提供的示例,您可以执行以下操作:

import numpy as np
np.intersect1d(b, c)

或者你也可以这样做:

cond = df['Freq'] >= 280
np.intersect1d(df[cond]['Ring'], df[~cond]['Ring'])