我正在开发一个可以优化SVM(LIBSVM工具箱)参数和最佳功能(输入)的系统。我的优化技术是和声搜索或遗传算法。我在将数据插入系统(Maxmin或美白)之前对数据进行了规范化,因此您知道我必须设置
-g gamma : set gamma in kernel function
-c cost : set the parameter C of C-SVC, epsilon-SVR, and nu-SVR
我的财务数据库存在二元分类问题。除此之外,我有时会使用降维技术,如“PCA”和其他技术。
那么您建议的伽马和成本参数搜索间隔是多少?
第二个问题:您认为我应该使用优化技术优化LIBSVM的其他哪些参数?
感谢。
PS。我的核心功能是" RBF"
答案 0 :(得分:3)
那么您建议的伽马和成本参数搜索间隔是多少?
基本上,您应该通过对网格单元大小进行一些有根据的猜测来进行启发式网格搜索,希望找到一个很好的最佳选择。查看LIBSVM包中的Grid.py文件。它会给你一些关于这些值的提示。有更多先进的技术可以做到这一点,但这是第一件值得尝试的事情。
第二个问题:您认为我应该使用优化技术优化LIBSVM的其他哪些参数?
这取决于您选择的内核。请注意,gamma不会影响所有内核类型(例如,线性类型)。您可以尝试调整其他内容,但从这两个开始,看看它是如何进行的。
答案 1 :(得分:1)
我建议你看看林博士Tips and tricks for liblinear提供的教程。除非你有充分的理由使用特定的内核尝试所有可用的内核。同样,我也会尝试使用非标准化/非标准化数据进行训练/测试。记住这些(缩放)是启发式的,没有人知道你的要求是什么类型的参数。探索所有。