流形学习是一种可视化数据的高维结构的好方法。 sklean提供了几种方法来实现此目的,如this page所示。但是,多种学习应用程序通常将自己局限于分类问题,因为训练样本的维数相同。以图像分类为例,训练数据库中的每个样本大小相同。但是,对于图像语义分割,训练样本没有一致的尺寸。我使用以下示例使我的观点更加清楚:
import numpy as np
training_image = np.random.randint(0,255,size=[215,215],dtype='float')
training_class_a_mask = np.random.randint(0,255,size=[215,215],dtype='bool')
training_class_b_mask = np.random.randint(0,255,size=[215,215],dtype='bool')
training_class_c_mask = np.random.randint(0,255,size=[215,215],dtype='bool')
training_class_a_sample = training_image[training_class_a_mask]
training_class_b_sample = training_image[training_class_b_mask]
training_class_c_sample = training_image[training_class_c_mask]
在以上代码中,我展示了一个训练样本图像,其中像素分为三类。假设现在我有数万个训练样本。我想使用流形学习将这些样本及其引爆类别可视化。我该怎么做?谢谢。