Question

我很抱歉在这里不得不问一个愚蠢的问题，但是在尝试清理数据集时我无法过滤变量。我正在使用具有8,000个调查回复的数据集，并希望过滤掉女性给出的所有回复。

因为1是男性，2是女性，所以我试图删除sex = 2的所有行。

library(dplyr)
(setwd("~/Desktop"))

df <- read.csv(file="Parenting.csv", header=TRUE, sep=",")

filter(df, sex==1)

执行此操作时，我得到以下响应，并且数据框中的观察次数不变，并且我的“性别”变量保留了“ 2”值

 [ reached getOption("max.print") -- omitted 4544 rows ]

在尝试研究解决方案时，我还尝试包括：

options(max.print=999999)

在我的过滤器语句之前，但这也使我的观察数和变量观察保持不变。

感谢您的帮助。我很绝望！

Answer 1

@ ronak-shah是正确的。之所以会遇到此问题，是因为您的命令确实将输出打印到控制台。您需要将其分配给变量。

df <- read.csv(file="Parenting.csv", header=TRUE, sep=",")

df1 <- filter(df, sex==1)

head(df1)

unique(df1$sex)