两个熊猫系列的字符串匹配

时间:2019-02-04 08:03:19

标签: python string pandas string-matching

我在两个不同的数据帧中有两个(地址)列,每列具有不同的长度,我希望从一个数据帧的一列中迭代每个元素,而在另一个数据帧的另一列中进行迭代。意思是,我希望检查第一个数据帧第一列中的每个元素是否与第二个数据帧第二列中的任何元素匹配,并返回一个布尔值。

如何在python中实现以上内容?

数据框1:

0 New Delhi, India
1 Mumbai, India
2 Bangalore, India
3 Dwarka, New Delhi, India

数据框2:

0 Nepal
1 Assam, India
2 Delhi

结果 :(长度应等于df 1的col 1的len)

True
False
False
True

1 个答案:

答案 0 :(得分:1)

import pandas as pd
sales1 = [{'account': 'Jones LLC', 'Jan': 150, 'Feb': 200, 'Mar': 140},
     {'account': 'Alpha Co',  'Jan': 200, 'Feb': 210, 'Mar': 215},
     {'account': 'Blue Inc',  'Jan': 50,  'Feb': 90,  'Mar': 95 }]

sales2 = [{'account': 'Jones LLC', 'Jan': 150, 'Feb': 200, 'Mar': 140},
     {'account': 'A',  'Jan': 200, 'Feb': 210, 'Mar': 215},
     {'account': 'S',  'Jan': 50,  'Feb': 90,  'Mar': 95 }]

df1 = pd.DataFrame(sales1)
df2 = pd.DataFrame(sales2)

def CheckDF(df1,df2):
    for (item, Value),(item1, Value1) in 
    zip(df1['account'].iteritems(),df2['account'].iteritems()):
        if len(str(Value).strip()) == len(str(Value1).strip()):
            print(True)
        else:
            print(False)

CheckDF(df1,df2)

DF1:

   Feb  Jan  Mar    account
0  200  150  140  Jones LLC
1  210  200  215   Alpha Co
2   90   50   95   Blue Inc

DF2:

   Feb  Jan  Mar    account
0  200  150  140  Jones LLC
1  210  200  215          A
2   90   50   95          S

输出:

True
False
False