scipy的fcluster / fclusterdata中的t(阈值)参数是多少?

时间:2017-03-09 09:56:05

标签: python scipy cluster-analysis

我正在尝试使用scipy.cluster.hierarchy进行一些分析。我得到了一个很好的树形图,但是当我想获得数据的实际聚类标签时,我必须为函数tfcluster设置fclusterdata参数。 docomentation只说它是float,但这个数字实际意味着什么?我想知道能够正确设置它。编辑 - 例如,当我想要 k 群集并在我的数据集中包含 m 样本时,我应该设置t什么?

1 个答案:

答案 0 :(得分:2)

阈值参数的含义取决于您在scipy's api中记录的{{ Form:: text('title', null, array('class' => 'form-control', 'required' => '')) }} 。如api中所述,有以下5个选项:

  1. criterion
  2. inconsistent
  3. distance
  4. maxclust
  5. monocrit
  6. maxclust_monocritmaxclust条件maxclust_monocrit都是要形成的最大群集数。所以关于你的编辑你应该把它设置为k。