如何使用支持向量机使用二进制数据集调整我的预测?

时间:2018-05-25 16:04:16

标签: python numpy dataframe machine-learning svm

所以我有这个数据集(1000列1000行),它有两个类,零或一个,我在下面应用了代码,它给了我58%的预测率我想调整它,但我真的很困惑在不同的类之间以及如何使用这种类型的数据选择它们的参数,所以我希望如果我在这里得到一些指导。

create procedure absoluteSalary (@documento varchar(8))
as
begin
select 
    nombre,
    apellido,
    sueldototal = 
        case 
            when sueldo < 500 then sueldo + cantidadhijos*200
            else sueldo + cantidadhijos*100 
        end
from empleados
--this isn't needed
--where @documento like '%'

Sample of the dataset

1 个答案:

答案 0 :(得分:0)

参数确实取决于数据,因此没有一般指导原则。但是,至少尝试“rbf”内核是值得的。另外,我首先要改变C参数,因为它通常具有最大的效果。但同样,这很大程度上取决于数据。