匹配变量以生成结果变量

时间:2017-05-19 13:20:04

标签: r

我正在尝试使用行级别信息获取声明列表中的代码计数。有3个变量

  1. 声明编号 - 保持不变
  2. 处理日期 - 每次再次处理索赔时更改
  3. 代码 - 每次再次处理索赔时重复
  4. 我正在尝试计算索赔的代码数量。

    请参阅附带的图片,并附上给定和预期的信息:

    Picture

1 个答案:

答案 0 :(得分:-1)

嗨,我想你可能会想要这样:

dat <- data.frame("Claim Number" = 123456789,
              Date = rep(c("1-Jan", "1-Feb"), each = c(5)),
              Code = sample(c("bla", "blub", "gna"), 10, replace = T))


match_frame <- data.frame(Code = unique(dat$Code), 
                          Code_number = paste0("Cd", 
                                               seq_along(unique(dat$Code))))

dat$Code_number <- match_frame$Code_number[match(dat$Code, 
                                                 match_frame$Code)]

首先,它识别代码的唯一/不同条目,并为它们创建一个计数名称。然后将名称合并到原始日期。我没有使用合并,因为这会改变表中的行顺序!

这样做确实有更高效和更精益的方式,但它可以帮助您理解如何解决这个问题。

最佳

索伦