我希望根据标题是否重复创建一个名为TERM_COMBINED的新列。我使用COUNTIF函数在Excel中创建了一个重复的标志,并将其带入R(我还不确定如何在R中执行此操作)。
下面是一个随机数据集,用于说明我要做的事情。
title Term Duplicate
RandomWord A 0
RanWord B 1
RanWord A 1
Cat A 0
基本上,如果duplicate = 1,那么TERM_COMBINED =" Both&#34 ;,否则它应该= term。所以输出将是:
TERM_COMBINED
A
BOTH
BOTH
A
这是我目前的代码:
if(df$duplicate == 1) {
df$TERM_COMBINED <- "Both"
} else {
df$TERM_COMBINED <- df$Term
}
然而,当我运行我的代码时,我会收到以下警告,并且生成的TERM_COMBINED列仅等于Term
Warning message:
In if (o_vShalevClay$Duplicate.Fin == 1) { :
the condition has length > 1 and only the first element will be used
此外,我如何将数据复制到新的数据框中,只保留1个重复的条目或从数据框中删除重复项。