我正在尝试使用scipy.cluster.hierarchy
进行一些分析。我得到了一个很好的树形图,但是当我想获得数据的实际聚类标签时,我必须为函数t
或fcluster
设置fclusterdata
参数。 docomentation只说它是float
,但这个数字实际意味着什么?我想知道能够正确设置它。编辑 - 例如,当我想要 k 群集并在我的数据集中包含 m 样本时,我应该设置t
什么?
答案 0 :(得分:2)
阈值参数的含义取决于您在scipy's api中记录的{{ Form:: text('title', null, array('class' => 'form-control', 'required' => '')) }}
。如api中所述,有以下5个选项:
criterion
inconsistent
distance
maxclust
monocrit
maxclust_monocrit
和maxclust
条件maxclust_monocrit
都是要形成的最大群集数。所以关于你的编辑你应该把它设置为k。