我使用EM群集器聚集了43574个时间序列。输出是24个簇。我在这里有一些问题。首先,处理24个集群是否实际有用?不是太多了吗?如果我将结果传递给神经外科医生,那么为了管理患者的目的,这些集群是否会起作用?我最重要的问题是,如下图所示,几个集群的可能性为0%?!那是什么意思?那为什么他们在不同的集群?任何帮助将不胜感激,这就是我得到的:
0 1892(4%) 1 5153(12%) 2 1594(4%) 3 1221(3%) 4 122(0%) 5 2714(6%) 6 7092(16%) 7 141(0%) 8 166(0%) 9 464(1%) 10 3331(8%) 11 4316(10%) 14 2411(6%) 15 2573(6%) 17 3063(7%) 18 142(0%) 19 4211(10%) 20 925(2%) 21 2038(5%) 22 5(0%)
答案 0 :(得分:0)
这些值不是似然,而是尺寸。
data=array([1892, 5153, 1594, 1221, 122, 2714, 7092, 141, 166,
464, 3331, 4316, 2411, 2573, 3063, 142, 4211, 925, 2038, 5])
for f in data * 100. / sum(data): print "%.1f%%" % f,
产生以下相对簇大小,并附加一个精度数字:
4.3% 11.8% 3.7% 2.8% 0.3% 6.2% 16.3% 0.3% 0.4% 1.1% 7.6% 9.9%
5.5% 5.9% 7.0% 0.3% 9.7% 2.1% 4.7% 0.0%
这些不是可能性。它是簇大小/数据集大小。