需求代码:使用6个不同的高斯分类器对IRIS数据集进行分类

时间:2019-10-23 01:58:19

标签: python machine-learning svm gaussian

1交叉验证数据设计 Iris数据集由150个带有1个整数标签的4维矢量样本组成。有3个 不同的标签,每个标签正好有50个样本。我们首先要进行5折交叉验证 如下:

  1. 对于第1类,将数据分成5倍:样本编号1-10、11-20、21-30、31-40和41-50,它们分别命名为f11,f12,f13,分别是f14和f15。

  2. 对于第2类,其折痕为f21,f22,f23,f24和f25。

  3. 对于第3类,其折痕为f31,f32,f33,f34和f35。

  4. 通过R1 = {f11,。 。 。,f14,f21,。 。 。,f24,f31,。 。 。,f34},并通过T1 = {f15,f25,f35}进行测试。

  5. 使用R1训练上述6个高斯分类器,计算出T1的准确性。

  6. 用R2-R5和T2-T5重复上述操作,以获得5个精度。

  7. 找到平均精度,并为Iris数据集确定最佳的高斯分类器。

2个支持向量机 SVM的超参数是C(不可分离性)和特定于内核的参数。使用5折交叉 验证

  1. 确定多项式内核函数的最佳C和度(阶数,秩等)。
  2. 确定最佳C和高斯核函数的标准偏差(或称为

RBF内核的参数)。 这些超参数选择过程称为网格搜索,因为离散参数的组合 选择器在多维向量空间中构成一个网格,我们调查每个网格以找到 最佳超参数集。 关键的设计问题是离散化连续参数空间的选择:例如, 通常选择C = {1,10,100,。 。 }。

0 个答案:

没有答案