假设我们有一个随机抽样分布,我们可以按如下方式计算和绘制相关的ecdf:
set.seed(1)
t1 <- rnorm(10000,mean=20)
t1 <- sort(t1)
t1[1:1000] <- t1[1:1000]*(-100)
t1[1001:7499] <- t1[1001:7499]*50
t1[7500:10000] <- t1[7500:10000]*100
cdft1 <- ecdf(t1)
plot(cdft1)
现在在这种情况下,经验分布中存在跳跃(由意图创建)。通过跳跃我的意思是,它增加了很多,比如说之前的价值超过了100%。这发生在位置7,500的示例中。我的问题是:我怎样才能最有效地找到这些“跳跃”指数?
答案 0 :(得分:2)
通过查看已排序的t1值的diff
,您可以接近您想要的内容。
St1 = sort(t1)
which(diff(St1) > abs(St1[-length(St1)]))
[1] 1000 7499
在点1000处,St1从-1632.8700切换到934.6916,这在技术上符合您的标准&#34;超过100%的变化&#34;。当有这样的符号变化时,我似乎不清楚需要什么。