标签: r variable-selection
我想对6个二分变量进行潜在的类聚类分析,并针对每个主题对这6个变量的每个响应数组计算类成员资格的后验概率。
问题是我没有选择变量的标准。我的算法运行了所有42种可能的变量组合(从6乘以3到6乘以6的组合),我可以找到具有最高AUROC的最佳组合,但在没有黄金标准的情况下将不起作用
我检查了Fleiss kappa统计信息,但kappa最高的组合的AUROC最高。在没有黄金标准的情况下,是否有任何统计数据可以显示变量的最佳组合?