我有一个由fMRI图像组成的数据集。每个图像属于一个类。数据集如下:
Class 1: 9 images
Class 2: 10 images
Class 3: 6 images
Class 4: 12 images
每个图像是4D(时间序列),即90x60x10x350,其中350是时间维度(即350个3D体积)。我想训练一下这个数据的分类器。
现在我想首先提取特征,然后通过应用例如应用特征选择。 PCA然后进行聚类,如论文“主要特征分析:fMRI数据的多变量特征选择方法”(http://www.hindawi.com/journals/cmmm/2013/645921/)中所述。对于特征提取,我看到以下可能性:
每个体素都是一个特征,是每个体素时间序列的平均值 被采取。每个图像恰好具有一个尺寸为90 * 60 * 10 = 54'000
每个体素是一个特征,每个时间点(即每个3D体积)是一个数据点。每幅图像都有350个特征向量,每个维度为90 * 60 * 10 = 54'000。
我更喜欢2.但我不确定这是不是一个好主意。
你会如何进行特征提取?如何以计算可行的方式使用基于相关的方法?
最后但并非最不重要的是,您将如何对数据集进行交叉验证?问题是不同的类是不平衡的。
非常感谢您的回答。