我正在尝试检查前面的值是否与同一列中的值匹配。因此,基本上我想检查df $ variable [1] == df $ variable [2]和df $ variable [2] == df $ variable [3],依此类推。我在下面附加了我的代码。我有矛盾的答案。我运行了一个特定的测试用例,说它们是一个匹配项,但是当我在整个列中运行它时,它不会检测到任何匹配项。
if(FinalLR$`Revised Claim`[2072] == FinalLR$`Revised Claim`[2073]){
print("YEP")
}
## Actual
for (i in 2:len(FinalLR$`Revised Claim`)){
if(FinalLR$`Revised Claim`[i] == FinalLR$`Revised Claim`[i-1]){
FinalLR$`Dist Claim#` <- 0
} else {
FinalLR$`Dist Claim#` <- 1
}
}
table(FinalLR$`Dist Claim#`)
输出 [1]“是”
1
7070
答案 0 :(得分:1)
我们可以进行lag
比较并转换为二进制
library(dplyr)
FinalLR %>%
mutate(`Dist Claim#` = as.integer(`Revised Claim` !=
lag(`Revised Claim`, default = first(`Revised Claim`))))