我对此很陌生,我可以使用一些帮助。 我想在R中实现两件事。目前我有一个名为“researchdata”的数据集。
假设我想在列/变量“City”中将文本“New York”更改为“NY”。 (所以不是一次整个数据集)我不确定命令是否不同但我也喜欢用数字来做,例如将“-1”改为“NA”。
如何删除特定列的NA或缺失值或实际上任何类型的值或字符串。假设我想删除列/变量城市的值“NA”和“-1”。
我尝试了一些命令,但我无法让它们工作,它们不是我想要的。我希望你们能提前帮助,谢谢你们。
答案 0 :(得分:1)
1。要操纵特定列中的数据,请查看dplyr::mutate
:
df <- data.frame(A = 1:5, B = 1:5)
library(dplyr)
df %>% mutate(A=ifelse(A==3,NA,A))
2. 要从数据中删除NA,您可以执行以下操作:
df1 <- df %>% mutate(A=ifelse(A==3,NA,A))
df1[complete.cases(df1),]
或使用dplyr::filter
:
df2 <- df
df2 %>% filter(!is.na(A))
请注意,这些操作会删除A==NA
。
(听起来你只是想学习,但为了获得最好的帮助,最好提供一个小数据集和一个特定问题(预期输出)。)