我的数据看起来像单变量分布,但它由两个变量表示:x是自变量,y与其概率密度成正比(如果曲线下面积是1)。 y值是连续的。如何将此数据集转换为单个变量,以便我可以适应分布?
我能想到的最好的是:
library(fGarch)
# simulate data from skewed distributions
i <- 10000
x <- rsnorm(i, xi = 0.5)
x.fit <- snormFit(x)
x.dens <- density(x, bw = "SJ", n = length(x))
# generate integral reps
k <- 1e6
times <- floor(x.dens$y*k)
# upsample
out <- rep(x.dens$x, times)
# downsample
x.smp <- sample(x = out, size = length(x))
# show that it seemed to work
plot(x = x.dens$x, y = x.dens$y, type = "l")
lines(density(x.smp, bw = "SJ"), col = "red")
有没有一种更聪明的方法可以做到这一点并没有导致极端数量的关系?我想我可以在&#34;密度&#34;中适应某种平滑功能。