Question

我想从数据库中排除性别！=“ M”和性别！=“ F”的每一行，并清理数据库。

谢谢。

这是我尝试过的：

CleanGender<-which(data$Gender!="M" & data$Gender!="F")

Answer 1

我们可以使用%in%来对列中的多个值进行子集化。它将检查列中是否存在这些值，创建逻辑表达式并将这些行作为子集

subset(data, gender %in% c("M", "F"))

Answer 2

假设性别不能同时为'M'和'F'（which依次在向量行上查看）：

# find index you want to keep
CleanGender_index <- which(data$Gender!="M" | data$Gender!="F")

# select corresponding rows, renaming your data frame is called `df_raw`
df_clean <- df_raw[CleanGender_index, ]

data可能不是您数据集的最佳名称，因为它也是R函数。

使用R

2 个答案: