我是DataFrame和python的新手,请帮助我,我的数据框看起来像:
index col1 col2 col3
0 A1 B1 C1
1 A1 B1 C2
2 A2 B1 C3
3 A3 B2 C4
4 A2 B1 C5
5 A4 B3 C6
6 A1 B1 C7
我希望在几次操作后在此数据框中添加更多列,这应该看起来像
index col1 col2 col3 count
0 A1 B1 C1 1
1 A1 B1 C2 2
2 A2 B1 D3 1
3 A3 B2 C4 1
4 A2 B1 D5 2
5 A4 B3 D6 1
6 A1 B1 C1 3
此计数列的值仅在col1& col2& (col3的值匹配大于或等于50%)如果这3个条件为真,则计数器应该增加。 我必须使用FuzzyWuzzy吗?
像:
col1 col2 col3 count
0 A1 B1 C1 1
1 A1 B1 C 2
(Matches) (Matches) (Matches 50%)