我的数据框看起来像这样:
@NonNullApi
理想的输出如下:
null
只有3个连击,而不是null
和df = pd.DataFrame({'A':['yes','yes','yes','yes','no','no','yes','yes','yes','no'],
'B':['yes','no','no','no','yes','yes','no','yes','yes','no']})
df
----------------------------
index A B
0 yes yes
1 yes no
2 yes no
3 yes no
4 no yes
5 no yes
6 yes no
7 yes yes
8 yes yes
9 no no
-----------------------------
的四个组合,所以----------------------------
A B
----------------------------
0 no no
1 yes no
2 yes yes
----------------------------
和yes
将是同一对,每对的频率并不重要。
我尝试使用no
,但是显然它将给您4对,我也尝试了yes no
。问题与this so post非常相似,但不完全相同,我从那里借来了示例。谢谢你们!
答案 0 :(得分:1)
使用np.sort
:
pd.DataFrame(np.sort(df,axis=1),columns =df.columns ).drop_duplicates()