最佳嵌入从300维过渡到2维

时间:2018-03-26 16:13:00

标签: embedding dimension reduction

我有一个问题,我无法找到答案。我想通过获取其组件的平均值然后在2d中呈现它来训练300维嵌入句子。但我正在寻找一种减少聚类重叠的方法,因为我想看看这些句子是如何分组的。

历史: 我开始减少300> 2个尺寸使用T-SNE,标准参数来自Sklearn。然后我读到我会更好地缩小300-> 50与PCA然后50-> 2 T-SNE与PCA init,真正改善了分组。您是否知道其他任何减少方法,其他参数可以改进这些工具,可能还有其他库甚至其他减少工具?

  • 问题 你知道接收嵌入句子的更好方法吗?

祝你好运

P.S。 我在python中执行了上述步骤

0 个答案:

没有答案