Question

我有一个大型数据集试图用Pandas阅读。我试图将其中一个列的值分成两部分，并检查这些集之间是否存在重叠值。使用下面的代码，结果是数组中有一些值重叠＆＃39; b＆＃39;和阵列＆＃39;。我想具体了解这些价值但不知道怎么做？任何人都可以指出我正确的方向吗？

df = pd.read_csv('....csv')

df2 = df[df['Freq']>= 280]
a=df2['Ring'].values
b=df2['Ring'].drop_duplicates().values

df3 = df[df['Freq']<= 280]
df3['Ring'].values
c=df3['Ring'].drop_duplicates().values

if np.all(b) == np.all(c):
    print ("They are overlapping")
else:   
    print ("They are not overlapping")

Answer 1

根据提供的示例，您可以执行以下操作：

import numpy as np
np.intersect1d(b, c)

或者你也可以这样做：

cond = df['Freq'] >= 280
np.intersect1d(df[cond]['Ring'], df[~cond]['Ring'])

比较Python

1 个答案: