如何比较两个表的id以及它们何时相等,在另一列中添加一个值

时间:2018-06-06 14:57:52

标签: python pandas mapping

我必须验证" number_id "在包含表1 中的ID列表的列中,并使用 表2 中的控件编号列表创建一个新列。

我在做:

import pandas as pd 

table_1 = pd.read_excel('path/file.xlsx', sheet_name="sheet 1")
table_2 = pd.read_excel('path/file.xlsx', dtype='str')

table_1[['Number_id_table_1']].head(5)

        Number_id_table_1
    0   [35904690, 20344131]
    1   [26360006]
    2   NaN
    3   [46780790]
    4   [355343]

table_2.head()

    control     account_id_nk
0   71996761124 10197651
1   49991227097 1263884
2   71981020953 876828
3   11964723845 35661849
4   47992004868 19071134

对值进行驻留并添加我正在执行的控制号:

from itertools import chain

def mapping_account_id(index, original_df, column_id_name = str()):
    original_index = index
    list_column_id = []
    if original_index in original_df:
        for ind in original_index:
            list_column_id.append(original_df.iloc[original_index][column_id_name])
            return list(set(list(chain(*list_column_id))))
    else:
        return None

table_1 ['Number_id_table_1_teste'] = table_1 ['Number_id_table_1'].apply(mapping_account_id, args = (table_2, 'control'))

结果是"无"对于每一行。但我知道表中存在这些值。

Number_id_table_1_teste
0   None
1   None
2   None
3   None
4   None

我预计该列" Number_id_table_1_teste "包含每个 number_id 控件 编号。

Number_id_table_1_teste
0   [21964258763, 81999403136]
1   [92993930352]
2   NaN
3   [17996018821]
4   [85988943884]

0 个答案:

没有答案