标签: scikit-learn cluster-analysis dimensionality-reduction perplexity
我使用t-SNE来显示细胞计数数据。我发现的大多数指南(https://distill.pub/2016/misread-tsne/)都警告选择困惑超参数会如何影响结果。
然而,我的数据集大小非常小,总是期望10-30分,因为只能为每个群集可视化一个点。在这种情况下,是否存在恒定,可靠的困惑值或者如何估计它。