如何从熊猫列中获取组的组合

时间:2019-03-27 07:08:28

标签: pandas pandas-groupby

我有一个带有列关键字的df:

Keyword   
A          
A          
A         
B
B
B
C
C
D
D

我正在使用以下代码分组

df_unique = df.groupby('Keyword').nunique()

但是我想要列中唯一组的组合。

o / p:

AB
AC
AD
BC
BD
CD

1 个答案:

答案 0 :(得分:1)

combinations用于列表理解,并将f-string用于连接元组:

from  itertools import combinations
L = [f'{a}{b}' for a, b in combinations(df['Keyword'].unique(), 2)]
print (L)
['AB', 'AC', 'AD', 'BC', 'BD', 'CD']

df1 = pd.DataFrame({'comb':L})
print (df1)
  comb
0   AB
1   AC
2   AD
3   BC
4   BD
5   CD

对于2列:

from  itertools import combinations
L1 = list(combinations(df['Keyword'].unique(), 2))
print (L1)
[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D'), ('C', 'D')]

df1 = pd.DataFrame(L1, columns=['comb1','comb2'])
print (df1)
  comb1 comb2
0     A     B
1     A     C
2     A     D
3     B     C
4     B     D
5     C     D