Question

我使用EM群集器聚集了43574个时间序列。输出是24个簇。我在这里有一些问题。首先，处理24个集群是否实际有用？不是太多了吗？如果我将结果传递给神经外科医生，那么为了管理患者的目的，这些集群是否会起作用？我最重要的问题是，如下图所示，几个集群的可能性为0％？！那是什么意思？那为什么他们在不同的集群？任何帮助将不胜感激，这就是我得到的：

0 1892（4％） 1 5153（12％） 2 1594（4％） 3 1221（3％） 4 122（0％） 5 2714（6％） 6 7092（16％） 7 141（0％） 8 166（0％） 9 464（1％） 10 3331（8％） 11 4316（10％） 14 2411（6％） 15 2573（6％） 17 3063（7％） 18 142（0％） 19 4211（10％） 20 925（2％） 21 2038（5％） 22 5（0％）

Answer 1

这些值不是似然，而是尺寸。

data=array([1892, 5153, 1594, 1221, 122, 2714, 7092, 141, 166,
  464, 3331, 4316, 2411, 2573, 3063, 142, 4211, 925, 2038, 5])

for f in data * 100. / sum(data): print "%.1f%%" % f,

产生以下相对簇大小，并附加一个精度数字：

4.3% 11.8% 3.7% 2.8% 0.3% 6.2% 16.3% 0.3% 0.4% 1.1% 7.6% 9.9%
5.5% 5.9% 7.0% 0.3% 9.7% 2.1% 4.7% 0.0%

这些不是可能性。它是簇大小/数据集大小。

对于某些集群，使用weka进行EM聚类，对数似然性为0？令人困惑的输出

1 个答案: