生成相关的分类(非序数)数据

时间:2016-04-01 09:32:06

标签: r simulate categorical-data

我尝试使用OrdGen包这样:

    marginal <-list(0.8,c(0.2,0.4),c(0.15,0.15,0.4)) # proba marginales
    corrcheck(marginal)             # Checks the lower and upper bounds of the correlation coefficients.
                # pas possible de définir des corrélations hors ces bornes avec ces marginales
    R <- matrix(c(1,0.3,0.3,0.3,1,0.3,0.3,0.3,1),3,3,byrow=T) # Correlation matrix
    n <- 100
    m <- ordsample(n=n, marginal=marginal, Sigma=R)

但我收到此错误消息

错误消息:

cut.default中的错误(valori [,i],bre​​aks = c(min(valori [,i]) - 1,qnorm(marginal [[i]]),:   '休息'不是唯一的 电话:ordsample - &gt;切 - &gt; cut.default

我猜它与边缘和“相关”矩阵之间的联系有关,也许它来自我想要模拟的分类数据不是序数的事实,所以提出的线性相关可以被打破非订购类别?

1 个答案:

答案 0 :(得分:0)

我发现了这个错误: 边际概率应该是累积的:

    marginal <-list(0.8,c(0.2,0.4),c(0.15,0.15,0.4)

应该是

    marginal <-list(0.8,c(0.2,0.6),c(0.15,0.3,0.7)

抱歉无用的帖子。我留下答案,因为它可能会帮助那些希望生成分类数据的人。