使用R

时间:2019-06-06 14:14:22

标签: r

我想从数据库中排除性别!=“ M”和性别!=“ F”的每一行,并清理数据库。

谢谢。

这是我尝试过的:

CleanGender<-which(data$Gender!="M" & data$Gender!="F")

2 个答案:

答案 0 :(得分:0)

我们可以使用%in%来对列中的多个值进行子集化。它将检查列中是否存在这些值,创建逻辑表达式并将这些行作为子集

subset(data, gender %in% c("M", "F"))

答案 1 :(得分:0)

假设性别不能同时为'M'和'F'(which依次在向量行上查看):

# find index you want to keep
CleanGender_index <- which(data$Gender!="M" | data$Gender!="F")

# select corresponding rows, renaming your data frame is called `df_raw`
df_clean <- df_raw[CleanGender_index, ]

data可能不是您数据集的最佳名称,因为它也是R函数。