1交叉验证数据设计 Iris数据集由150个带有1个整数标签的4维矢量样本组成。有3个 不同的标签,每个标签正好有50个样本。我们首先要进行5折交叉验证 如下:
对于第1类,将数据分成5倍:样本编号1-10、11-20、21-30、31-40和41-50,它们分别命名为f11,f12,f13,分别是f14和f15。
对于第2类,其折痕为f21,f22,f23,f24和f25。
对于第3类,其折痕为f31,f32,f33,f34和f35。
通过R1 = {f11,。 。 。,f14,f21,。 。 。,f24,f31,。 。 。,f34},并通过T1 = {f15,f25,f35}进行测试。
使用R1训练上述6个高斯分类器,计算出T1的准确性。
用R2-R5和T2-T5重复上述操作,以获得5个精度。
找到平均精度,并为Iris数据集确定最佳的高斯分类器。
2个支持向量机 SVM的超参数是C(不可分离性)和特定于内核的参数。使用5折交叉 验证
RBF内核的参数)。 这些超参数选择过程称为网格搜索,因为离散参数的组合 选择器在多维向量空间中构成一个网格,我们调查每个网格以找到 最佳超参数集。 关键的设计问题是离散化连续参数空间的选择:例如, 通常选择C = {1,10,100,。 。 }。