标签: r bigdata
这是一个高级问题,请耐心等待。
我想运行tSNE的日期是几千万。由于这确实是计算上昂贵的算法,因此我想先对该数据集进行下采样,在该子集上运行tSNE,然后再进行上采样(以某种方式进行),以便可以将非tSNE数据绘制在tSNE映射上。
我的想法是,我将数据集分为几个部分,使用相同的种子在每个部分上运行tSNE,以便它们对齐。
这是否可行,或者有更好的方法吗?