我有一个数据集,其中的列Disease
包含字符串值。我还有另一个变量,它是rare_disease
种罕见病的名字列表。
我想检查列Disease
的每个单元格是否包含列表rare_disease
中的元素,如果包含,则在我的数据框中创建一个新列并给出值1到该条目。
我尝试使用ifelse
函数,如下所示:
FinalData$RareDisease <- ifelse(FinalData$Disease == rare_disease , 1, 0)
但是我想这会检查两个变量是否相同,所以给我一个错误,即它们的长度不相同。
编辑:重复答案(匹配,%is%,any())中建议的功能不适用于我,我想这是因为它们正在寻找列表rare_disease
与我的列表之间的完全匹配目标列。相反,如果我的列表中的一个元素在列中匹配,我需要1(或TRUE)。