我想从数据库中排除性别!=“ M”和性别!=“ F”的每一行,并清理数据库。
谢谢。
这是我尝试过的:
CleanGender<-which(data$Gender!="M" & data$Gender!="F")
答案 0 :(得分:0)
我们可以使用%in%
来对列中的多个值进行子集化。它将检查列中是否存在这些值,创建逻辑表达式并将这些行作为子集
subset(data, gender %in% c("M", "F"))
答案 1 :(得分:0)
假设性别不能同时为'M'和'F'(which
依次在向量行上查看):
# find index you want to keep
CleanGender_index <- which(data$Gender!="M" | data$Gender!="F")
# select corresponding rows, renaming your data frame is called `df_raw`
df_clean <- df_raw[CleanGender_index, ]
data
可能不是您数据集的最佳名称,因为它也是R函数。