我有一个问题,我无法找到答案。我想通过获取其组件的平均值然后在2d中呈现它来训练300维嵌入句子。但我正在寻找一种减少聚类重叠的方法,因为我想看看这些句子是如何分组的。
历史: 我开始减少300> 2个尺寸使用T-SNE,标准参数来自Sklearn。然后我读到我会更好地缩小300-> 50与PCA然后50-> 2 T-SNE与PCA init,真正改善了分组。您是否知道其他任何减少方法,其他参数可以改进这些工具,可能还有其他库甚至其他减少工具?
祝你好运
P.S。 我在python中执行了上述步骤