在格子直方图中如何只保留99%的数据?

时间:2013-06-18 14:30:31

标签: r histogram lattice percentile

在我的点阵直方图中:

histogram(~bill|group,data=mydat,type='count',nint=50,layout=c(9,3))

如何在每组中保留99%之前的“账单”数据?

1 个答案:

答案 0 :(得分:1)

您可能希望从整个帐单数据中删除异常值。首先将数据复制到新变量

    mydat$bill.cleaned=mydat$bill

然后将大值设置为缺失

    cuttoff= qnorm(.99,mean(mydat$bill),sd(mydat$bill))
    mydat$bill.cleaned[which(mydat$bill > cuttoff)]=NA

然后您可以显示已清理数据的直方图。

或者,如果您只想在每个组中删除ouliers。你需要做一个与上面相同的事情,附加一个申请声明。