我有一个大型数据集试图用Pandas阅读。我试图将其中一个列的值分成两部分,并检查这些集之间是否存在重叠值。使用下面的代码,结果是数组中有一些值重叠' b'和阵列'。我想具体了解这些价值但不知道怎么做?任何人都可以指出我正确的方向吗?
df = pd.read_csv('....csv')
df2 = df[df['Freq']>= 280]
a=df2['Ring'].values
b=df2['Ring'].drop_duplicates().values
df3 = df[df['Freq']<= 280]
df3['Ring'].values
c=df3['Ring'].drop_duplicates().values
if np.all(b) == np.all(c):
print ("They are overlapping")
else:
print ("They are not overlapping")
答案 0 :(得分:0)
根据提供的示例,您可以执行以下操作:
import numpy as np
np.intersect1d(b, c)
或者你也可以这样做:
cond = df['Freq'] >= 280
np.intersect1d(df[cond]['Ring'], df[~cond]['Ring'])