从其他数据集中获取显示一组帐户具有相似行为的帐户

时间:2019-04-19 11:32:18

标签: comparison similarity

我有一组2009年以来的帐户,我的目标变量是违约概率和一组变量。我有2015年的另一个数据集,具有相同的目标变量和相同的变量集。现在我想要的是2009年数据中的所有帐户,我想基于行为将2015年数据一对一映射 例 2009年数据:2015年数据:

Account_id V1 V2 target_var

1 0.1 1 0.5
 2 0.7 2 0.2
 3 0.3 3 0.1
 4 0.2 4 0.3

Account_id V1 V2 target_var

11 0.2 5 0.7

12 0.7 2 0.4

13 0.6 3 0.8

14 0.3 3 0.6

15 0.4 1 0.3

16 0.1 3 0.9

我想要类似这样的输出

Account_id target_var_2009 target_var_2015
 1 0.5 0.7
 2 0.2 0.4
 3 0.1 0.8
 4 0.3 0.6

不考虑数字。我只是创建了一个随机数据集。我希望在1,2,3,4的帐户11,12,13,14,15,16中具有相同统计行为的帐户

0 个答案:

没有答案