我可以在数据帧列中使用模糊wuzzy来执行操作

时间:2018-05-02 14:58:20

标签: python pandas dataframe

我是DataFrame和python的新手,请帮助我,我的数据框看起来像:

index col1 col2 col3
0      A1   B1   C1
1      A1   B1   C2
2      A2   B1   C3
3      A3   B2   C4
4      A2   B1   C5
5      A4   B3   C6
6      A1   B1   C7

我希望在几次操作后在此数据框中添加更多列,这应该看起来像

index col1 col2 col3  count
0      A1   B1   C1     1    
1      A1   B1   C2     2
2      A2   B1   D3     1
3      A3   B2   C4     1
4      A2   B1   D5     2 
5      A4   B3   D6     1
6      A1   B1   C1     3

此计数列的值仅在col1& col2& (col3的值匹配大于或等于50%)如果这3个条件为真,则计数器应该增加。 我必须使用FuzzyWuzzy吗?

像:

    col1        col2       col3             count
0    A1          B1         C1                1
1    A1          B1         C                 2
   (Matches)    (Matches)  (Matches 50%)

0 个答案:

没有答案