我在R中导入了一个数据集,我试图删除异常值。到目前为止,我做到了这一点,我用箱线图确定了所有异常值,并将它们保存在变量中。
outlier_values_2 <- boxplot.stats(myfileswoNA$smart_1_raw)$out # outlier values.
boxplot(myfileswoNA$smart_1_raw, main="Outlier", boxwex=0.1)
hist(myfileswoNA$smart_1_raw)
summary(myfileswoNA$smart_1_raw)
现在我正在尝试删除带有已识别异常值的行。我可以用一个特定值来做到这一点:
example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]
但我想要做的是立即删除所有异常值,这些异常值存储在变量outlier_values_2
中
例如,这种方式不起作用:
example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]
任何人都可以帮我解决这个问题吗?或者有人有想法吗?
答案 0 :(得分:0)
@LAP的回答帮助我解决了我的问题。 以下是他的建议:
如果所有离群值都存储在
outlier_values_2
中, 尝试myfileswoNA[!myfileswoNA$smart_1_raw %in% outlier_values_2,]