names Class Category label
ram A Red one
ravi A Red two
gopal B Green three
Sri C Red four
my_list1=["Category"]
my_list2=["Class"]
I need to get the combination counts between these two columns.
我正在尝试获取一些选定列的组合。 my_list2甚至有多个。
I tried,
df[mylist1].value_counts()
它适用于一个sinigle专栏。但我想基于my_list1
为my_list2中的多个列做些什么我想要的输出应该是,
output_df,
Value Counts
Red.A 2
Red.C 1
Green.B 1
答案 0 :(得分:1)
我认为您需要先加入两个列表,然后创建Series
和最后value_counts
:
print (df)
names Class Category label Class1
0 ram A Red one E
1 ravi A Red two G
2 gopal B Green three B
my_list1=["Category"]
my_list2=["Class", "Class1"]
df = df[my_list1 + my_list2].apply('.'.join, axis=1).value_counts()
print (df)
Red.A.E 1
Red.A.G 1
Green.B.B 1
dtype: int64
详情:
print (df[my_list1 + my_list2])
Category Class Class1
0 Red A E
1 Red A G
2 Green B B
print (df[my_list1 + my_list2].apply('.'.join, axis=1))
0 Red.A.E
1 Red.A.G
2 Green.B.B
dtype: object
答案 1 :(得分:1)
您可以使用str.cat
之类的
In [5410]: my_list1 = ["Category"]
...: my_list2 = ["Class", "Class1"]
In [5411]: df[my_list1+my_list2].apply(lambda x: x.str.cat(sep='.'), axis=1).value_counts()
Out[5411]:
Green.B.B 1
Red.A.E 1
Red.A.G 1
dtype: int64
另外
In [5516]: pd.Series('.'.join(x) for x in df[my_list1 + my_list2].values).value_counts()
Out[5516]:
Green.B.B 1
Red.A.E 1
Red.A.G 1
dtype: int64
Or
In [5517]: pd.Series(map('.'.join, df[my_list1 + my_list2].values)).value_counts()
Out[5517]:
Green.B.B 1
Red.A.E 1
Red.A.G 1
dtype: int64