从折线图中删除异常值

时间:2014-07-21 17:17:35

标签: r ggplot2 outliers

我想绘制一个有明显异常值的折线图。以下数据集是我正在使用的数据集的一个子集:

          Date PCROI
717 2014-06-28    38
718 2014-06-29    41
719 2014-06-30    36
720 2014-07-01   734
721 2014-07-02    60
722 2014-07-03    78
723 2014-07-04    90
724 2014-07-05    68
725 2014-07-06    55
726 2014-07-07    57

如果我使用ggplot2绘制图表,图表就不那么糟糕了。

ggplot(data = example, aes(x = Date, y = PCROI)) + geom_line()

Plot

不幸的是,我正在使用的时间序列比PCROI的中位数长51。 如何在不排除数据集中的值的情况下调整图表?

1 个答案:

答案 0 :(得分:1)

如果你有一些异常值标准(例如,如果PRCOI大于100),你可以使用subset命令,如果你对插入删除的点进行插值,那么你可以使用{/ p>}

example <- read.table(header = TRUE, text = "          Date PCROI
717 2014-06-28    38
718 2014-06-29    41
719 2014-06-30    36
720 2014-07-01   734
721 2014-07-02    60
722 2014-07-03    78
723 2014-07-04    90
724 2014-07-05    68
725 2014-07-06    55
726 2014-07-07    57")
example$Date <- as.Date(example$Date)

ggplot(subset(example, PCROI <= 100), aes(Date, PCROI)) + geom_line()