如何为连接的单独列中的值创建唯一ID号?

时间:2017-01-05 18:14:11

标签: r

我有一个奇怪的数据集,在一列中有一个索赔号,另一列中有一个"伴侣"数。随播数字值等于与您正在查看的伴随号码对应的声明所在事件中发生的不同声明号码,或者空白表示声明号码是随播广告号码。

所有索赔号在整个数据集中都是唯一的。

这最多的是每次活动3件索赔。我需要创建一个唯一标识符列,将这些声明分组为1个唯一事件。大多数1个索赔1事件案例,但每个事件大量2个案例,每个事件大约3个案例。

每个事件2个案例示例:

claim_num    companion_num
A            B
B            A

或者

claim_num    companion_num
A            B
B            B

每个事件3个案例例如:

claim_num    companion_num
A            B
B            
C            A

每个事件场景3个案例特别棘手,因为可能会发生许多可能的组合。在此示例中,声明号B是原始'因为所有路径都可以追溯到索赔B。

我需要看起来像这样的东西,并且适用于2个案例和3个案例事件:

claim_num    companion_num    ID
A            B                1
B                             1
C            A                1

或者

claim_num    companion_num    ID
A            B                1
B            B                1

我曾经多次尝试过excel,但我无法弄清楚如何做到这一点。我知道一些R所以我希望在这里提供一些指导。我已经到了可以填写任何空白伴随号码及其索赔号的地步,但就是这样。

0 个答案:

没有答案