我有一个数据框;请点击链接查看数据框的屏幕截图 dataframe
如您所见,在“类”列中,我们有“负数。|唯一标识符”和其他一些其他因素,例如甲亢。我主要关心的是选择所有行并将其替换为“ negative。| uniqueidentifier”。我只想使用“负数”。
此外,对于其他出现甲状腺功能亢进且具有唯一标识符的列。我也想对他们做同样的事情。
请帮助。
答案 0 :(得分:0)
检出tidyr
软件包和separate
函数。这是一个类似于您的数据框的示例:
classes <- c(rep("negative.|185",5),rep("hyperthyroid.|3445"))
library(tidyr)
separate(as.data.frame(classes), col = classes , into = c("classes","classes_ID"), sep = ".\\|")
# classes classes_ID
#1 negative 185
#2 negative 185
#3 negative 185
#4 negative 185
#5 negative 185
#6 hyperthyroid 3445