随时间推移逐组跟踪变化

时间:2018-12-04 11:29:26

标签: python list concatenation pandas-groupby lag

我有以下数据框架,该数据框架指示每个人与哪个雇主相关的项目(并且他们可以与一个项目的多个雇主联系)。年份列表示年份(数字表示年份中项目的顺序(项目20122在项目20121之后执行))

Employee_id = [7102825752, 7102825752, 7102825752, 7102825752, 7102825752, 7102825752, 7102825752, 7102825752, 7102825752, 7102825752]
Project_id = [28253288, 28648301, 28800042, 29113983, 29126250, 29364924, 29678870, 29691896, 29691235, 29691235]
Employer_id = [60031437, 60031437, 60033114, 115272656, 110625857, 60031437, 60031437, 60031437, 61273455, 85972742]
Year = [20121, 20122, 20131, 20141, 20151, 20152, 20161, 20161, 20162, 20162]

import pandas as pd
data = pd.DataFrame({"Employee_id":Employee_id,"Project_id":Project_id,"Employer_id":Employer_id,"Year":Year})

我的目标是跟踪个人在组织之间的变化,如下表右侧的两列所示。我想知道与上一年相比,他们离开了哪些组织,以及他们开始为哪些新组织工作(没关系,他们过去可能也曾为他们工作过)。

enter image description here

1 个答案:

答案 0 :(得分:0)

我找到了解决我的问题的方法,也许不太好,但是行得通

<?Type?>