图像数据集的特征提取和交叉验证

时间:2015-05-23 20:53:25

标签: machine-learning feature-extraction cross-validation feature-selection

我有一个由fMRI图像组成的数据集。每个图像属于一个类。数据集如下:

Class 1: 9 images 
Class 2: 10 images 
Class 3: 6 images 
Class 4: 12 images

每个图像是4D(时间序列),即90x60x10x350,其中350是时间维度(即350个3D体积)。我想训练一下这个数据的分类器。

现在我想首先提取特征,然后通过应用例如应用特征选择。 PCA然后进行聚类,如论文“主要特征分析:fMRI数据的多变量特征选择方法”(http://www.hindawi.com/journals/cmmm/2013/645921/)中所述。对于特征提取,我看到以下可能性:

  1. 每个体素都是一个特征,是每个体素时间序列的平均值 被采取。每个图像恰好具有一个尺寸为90 * 60 * 10 = 54'000

  2. 的特征向量
  3. 每个体素是一个特征,每个时间点(即每个3D体积)是一个数据点。每幅图像都有350个特征向量,每个维度为90 * 60 * 10 = 54'000。

  4. 将图像的整个时间序列的所有体素放入一个特征向量中 尺寸90 * 60 * 10 * 350 = 18'900'000。每个图像只有一个特征向量。
  5. 将体素之间的相关值作为特征值。但这是     计算上不可行。
  6. 我更喜欢2.但我不确定这是不是一个好主意。

    你会如何进行特征提取?如何以计算可行的方式使用基于相关的方法?

    最后但并非最不重要的是,您将如何对数据集进行交叉验证?问题是不同的类是不平衡的。

    非常感谢您的回答。

0 个答案:

没有答案