Renamng和删除R中数据集中的特定NA

时间:2017-07-01 12:30:14

标签: r data-manipulation data-cleaning

我对此很陌生,我可以使用一些帮助。 我想在R中实现两件事。目前我有一个名为“researchdata”的数据集。

1。我喜欢操纵一个特定列中的数据。

假设我想在列/变量“City”中将文本“New York”更改为“NY”。 (所以不是一次整个数据集)我不确定命令是否不同但我也喜欢用数字来做,例如将“-1”改为“NA”。

2。删除特定列中的特定值

如何删除特定列的NA或缺失值或实际上任何类型的值或字符串。假设我想删除列/变量城市的值“NA”和“-1”。

我尝试了一些命令,但我无法让它们工作,它们不是我想要的。我希望你们能提前帮助,谢谢你们。

1 个答案:

答案 0 :(得分:1)

1。要操纵特定列中的数据,请查看dplyr::mutate

df <- data.frame(A = 1:5, B = 1:5)
library(dplyr)
df %>% mutate(A=ifelse(A==3,NA,A))

2. 要从数据中删除NA,您可以执行以下操作:

df1 <- df %>% mutate(A=ifelse(A==3,NA,A))
df1[complete.cases(df1),]

或使用dplyr::filter

df2 <- df
df2 %>% filter(!is.na(A))

请注意,这些操作会删除A==NA

所在的整行

(听起来你只是想学习,但为了获得最好的帮助,最好提供一个小数据集和一个特定问题(预期输出)。)