Question

我有一个包含两列的csv：员工ID 'eid'和经理员工ID 'mid'。尝试获取python代码，为每位员工添加显示管理员员工ID的列，直至CEO。 CEO的员工ID为1.最终我想将结果写回csv。

所以数据看起来像：

eid,    mid
111,    112
113,    112
112,    114
114,    115
115,    1

我期待输出看起来像这样。请注意，虽然没有员工拥有超过4个级别的经理，但我还想学习动态命名列的python。

eid,    mid,    l2mid   l3mid   l4mid
111,    112,    114,    115,    1
113,    112,    114,    115,    1
112,    114,    115,    1   
114,    115,    1       
115,    1

我对编码非常陌生，并试图自学，但一直陷入困境。我的问题： 1）我试图使用在给定行中取mid的for语句，然后找到该经理的经理，依此类推，直到我到达CEO。我一直在尝试这些方面：

df = pd.read_csv('employee.csv') 
if mid =! 1 
for i in df:
    df.['l2mid'] = df.loc[df.eid == [i], [mid]]

也许我正在向后倾斜，我应该尝试按经理对所有员工进行分组？该代码将如何不同？

我见过C#和sql中的解决方案，我看过构建trees和json的解决方案。我真的很感激任何帮助和鼓励。

更新：下一步是添加国家/地区列 - 请参阅：entry here

Answer 1

我相信有更好的解决方案，但这很有效。我用零填空。

a = []
for index, row in df.iterrows():
    res = df[df['eid']==row['mid']]['mid'].values
    a.append(0 if not res else res[0])
df['l2mid'] = a

a = []
for index, row in df.iterrows():
    res = df[df['eid']==row['l2mid']]['mid'].values
    a.append(0 if not res else res[0])
df['l3mid'] = a

a = []
for index, row in df.iterrows():
    res = df[df['eid']==row['l3mid']]['mid'].values
    a.append(0 if not res else res[0])
df['l4mid'] = a

df
# output :
# eid   mid l2mid   l3mid   l4mid
# 0 111 112 114 115 1
# 1 113 112 114 115 1
# 2 112 114 115 1   0
# 3 114 115 1   0   0
# 4 115 1   0   0   0

您可以为例程定义一个函数。

def search_manager(target_column, new_column):
    a = []
    for index, row in df.iterrows():
        res = df[df['eid']==row[target_column]]['mid'].values
        a.append(0 if not res else res[0])
    df[new_column] = a

search_manager('mid', 'l2mid')
search_manager('l2mid', 'l3mid')
search_manager('l3mid', 'l4mid')

来自经理和员工ID的python层次结构

1 个答案: