如何将PCA和tSNE用于采样的加权数据?

时间:2019-03-08 04:48:21

标签: machine-learning statistics data-science pca sampling

我正在探索海量数据,然后在完整数据上应用 PCA tSNE 来提取模式/集群。例如采样到特征= (1,000,000 * 1,000)中,然后将50个 PC (1,000,000 * 50) tSNE 嵌入2d (1,000,000 * 2)中。

然后我用权重例如样本变为特征= (10,000 * 1,000),样本权重= (10,000 * 1),现在 PCA (10,000 * 50) tSNE (10,000 * 2)显示出不同的特征模式和簇。

是否仍然可以对加权样本使用 PCA tSNE ,或者只需要考虑抽样策略的过程就可以了吗?

谢谢

0 个答案:

没有答案