我有一个带有列关键字的df:
Keyword
A
A
A
B
B
B
C
C
D
D
我正在使用以下代码分组
df_unique = df.groupby('Keyword').nunique()
但是我想要列中唯一组的组合。
AB
AC
AD
BC
BD
CD
答案 0 :(得分:1)
将combinations
用于列表理解,并将f-string
用于连接元组:
from itertools import combinations
L = [f'{a}{b}' for a, b in combinations(df['Keyword'].unique(), 2)]
print (L)
['AB', 'AC', 'AD', 'BC', 'BD', 'CD']
df1 = pd.DataFrame({'comb':L})
print (df1)
comb
0 AB
1 AC
2 AD
3 BC
4 BD
5 CD
对于2列:
from itertools import combinations
L1 = list(combinations(df['Keyword'].unique(), 2))
print (L1)
[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D'), ('C', 'D')]
df1 = pd.DataFrame(L1, columns=['comb1','comb2'])
print (df1)
comb1 comb2
0 A B
1 A C
2 A D
3 B C
4 B D
5 C D