我有一个包含两列的csv:员工ID 'eid'
和经理员工ID 'mid'
。尝试获取python代码,为每位员工添加显示管理员员工ID的列,直至CEO。 CEO的员工ID为1.最终我想将结果写回csv。
所以数据看起来像:
eid, mid
111, 112
113, 112
112, 114
114, 115
115, 1
我期待输出看起来像这样。请注意,虽然没有员工拥有超过4个级别的经理,但我还想学习动态命名列的python。
eid, mid, l2mid l3mid l4mid
111, 112, 114, 115, 1
113, 112, 114, 115, 1
112, 114, 115, 1
114, 115, 1
115, 1
我对编码非常陌生,并试图自学,但一直陷入困境。我的问题:
1)我试图使用在给定行中取mid
的for语句,然后找到该经理的经理,依此类推,直到我到达CEO。我一直在尝试这些方面:
df = pd.read_csv('employee.csv')
if mid =! 1
for i in df:
df.['l2mid'] = df.loc[df.eid == [i], [mid]]
也许我正在向后倾斜,我应该尝试按经理对所有员工进行分组?该代码将如何不同?
我见过C#和sql中的解决方案,我看过构建trees和json的解决方案。我真的很感激任何帮助和鼓励。
更新:下一步是添加国家/地区列 - 请参阅:entry here
答案 0 :(得分:1)
我相信有更好的解决方案,但这很有效。我用零填空。
a = []
for index, row in df.iterrows():
res = df[df['eid']==row['mid']]['mid'].values
a.append(0 if not res else res[0])
df['l2mid'] = a
a = []
for index, row in df.iterrows():
res = df[df['eid']==row['l2mid']]['mid'].values
a.append(0 if not res else res[0])
df['l3mid'] = a
a = []
for index, row in df.iterrows():
res = df[df['eid']==row['l3mid']]['mid'].values
a.append(0 if not res else res[0])
df['l4mid'] = a
df
# output :
# eid mid l2mid l3mid l4mid
# 0 111 112 114 115 1
# 1 113 112 114 115 1
# 2 112 114 115 1 0
# 3 114 115 1 0 0
# 4 115 1 0 0 0
您可以为例程定义一个函数。
def search_manager(target_column, new_column):
a = []
for index, row in df.iterrows():
res = df[df['eid']==row[target_column]]['mid'].values
a.append(0 if not res else res[0])
df[new_column] = a
search_manager('mid', 'l2mid')
search_manager('l2mid', 'l3mid')
search_manager('l3mid', 'l4mid')