应用错误收集

需求代码：使用6个不同的高斯分类器对IRIS数据集进行分类

时间：2019-10-23 01:58:19

标签： python machine-learning svm gaussian

1交叉验证数据设计 Iris数据集由150个带有1个整数标签的4维矢量样本组成。有3个不同的标签，每个标签正好有50个样本。我们首先要进行5折交叉验证如下：

对于第1类，将数据分成5倍：样本编号1-10、11-20、21-30、31-40和41-50，它们分别命名为f11，f12，f13，分别是f14和f15。
对于第2类，其折痕为f21，f22，f23，f24和f25。
对于第3类，其折痕为f31，f32，f33，f34和f35。
通过R1 = {f11，。。。，f14，f21，。。。，f24，f31，。。。，f34}，并通过T1 = {f15，f25，f35}进行测试。
使用R1训练上述6个高斯分类器，计算出T1的准确性。
用R2-R5和T2-T5重复上述操作，以获得5个精度。
找到平均精度，并为Iris数据集确定最佳的高斯分类器。

2个支持向量机 SVM的超参数是C（不可分离性）和特定于内核的参数。使用5折交叉验证

确定多项式内核函数的最佳C和度（阶数，秩等）。
确定最佳C和高斯核函数的标准偏差（或称为

RBF内核的参数）。这些超参数选择过程称为网格搜索，因为离散参数的组合选择器在多维向量空间中构成一个网格，我们调查每个网格以找到最佳超参数集。关键的设计问题是离散化连续参数空间的选择：例如，通常选择C = {1，10，100，。。 }。

0 个答案:

没有答案