以下是示例数据
data<-rbeta(7974, 1, 8, ncp = 0)
hist(data)
数据介于0和1之间(基本上是比例数据)并且也是偏斜的。直方图如下所示:
这些数据实际上显示了不同地点作物所覆盖面积的比例。以下是此直方图的曲线:
d1 <- density(data)
plot(d1$x, d1$y, type = "n")
lines(d1, col = "blue")
如何获得拐点的x值列表(蓝线的曲线从正变为负的位置)?它可能可以使用微积分完成,但我不是从数学背景,并想知道是否有任何R包可以做到。
比例值显示某个地点的作物覆盖面积。我有7974个位置,此图表显示了每个位置在作物下覆盖了多少区域。我想将此比例转换为二进制数据,即是或否(1和0),无论该位置是否有裁剪。在某种程度上,我将连续数据转换为二进制数据。我认为我会这样做的方法是选择一个阈值,高于该阈值,一切都是1(作物存在),其余的是0(不存在)。这就是为什么我要寻找一个阈值,我认为我的拐点可以告诉我。