如何从一组稀疏矩阵构建训练数据

时间:2021-07-16 07:24:10

标签: python matrix svm random-forest feature-selection

我正在尝试为 2 类分类问题(例如 A 类和 B 类)构建模型。我有两个数据集,我想从中生成训练、测试和验证数据集(如下所示):

  1. Dataset-1:该数据集有 1092 个 A 类样本,其中每个样本作为 1481x163 和 1 个标签(即 A 类)的特征矩阵。该数据集的每个样本都具有相同的长度为 1481 的索引(假设是一组生物标志物)和相同的 163 个特征。矩阵非常稀疏。

  2. Dataset-2:该数据集是 B 类的 82 个样本,其中每个样本具有与 A 类相同大小的特征矩阵(即 1481 个生物标志物 x 163 个特征)和 1 个标签(即类- B)。这里的矩阵也非常稀疏。

我想为两类分类构建一个模型,但我的问题是如何通过组合两个类来生成一个单一的特征矩阵(特别是对于非 ANN 模型,如 RF、SVM 等)。通过垂直或水平展平每个矩阵然后将它们连接起来可能没有用,因为数组的大小将非常大,并且很难从 163 个特征中找到重要特征。

请提出建议。

0 个答案:

没有答案
相关问题