我很抱歉在这里不得不问一个愚蠢的问题,但是在尝试清理数据集时我无法过滤变量。我正在使用具有8,000个调查回复的数据集,并希望过滤掉女性给出的所有回复。
因为1是男性,2是女性,所以我试图删除sex = 2的所有行。
library(dplyr)
(setwd("~/Desktop"))
df <- read.csv(file="Parenting.csv", header=TRUE, sep=",")
filter(df, sex==1)
执行此操作时,我得到以下响应,并且数据框中的观察次数不变,并且我的“性别”变量保留了“ 2”值
[ reached getOption("max.print") -- omitted 4544 rows ]
在尝试研究解决方案时,我还尝试包括:
options(max.print=999999)
在我的过滤器语句之前,但这也使我的观察数和变量观察保持不变。
感谢您的帮助。我很绝望!
答案 0 :(得分:2)
@ ronak-shah是正确的。之所以会遇到此问题,是因为您的命令确实将输出打印到控制台。您需要将其分配给变量。
df <- read.csv(file="Parenting.csv", header=TRUE, sep=",")
df1 <- filter(df, sex==1)
head(df1)
unique(df1$sex)