在R

时间:2017-03-17 06:29:12

标签: r statistics svm

我需要在R中拟合线性SVM,其具有一个特征作为响应,并且模型中的每个其他特征的线性二次和交互项作为预测器。 是否有一个函数可以帮助计算其他预测变量的线性,二次和交互项(大约15个单独的预测变量)

1 个答案:

答案 0 :(得分:2)

y ~ . :此处.被解释为在拟合模型时使用的数据框中除y之外的所有变量。它相当于预测变量的线性组合。例如y ~ var1 + var2 + var3+...+var15

y ~ . ^ 2 将给出数据框中变量的所有线性(主效应)和二阶交互项。它相当于y ~ var1 + var2 + ...+var15 + var1:var2 + var1:var3 + var1:var4...and so on

y ~ var1 + var2 + ...+var15 + I(var1^2) + I(var2^2) + I(var3^2)...+I(var15^2) :这里我(var ^ 2)表示数据框中一个变量的二次多项式。

<强> y ~ poly(var1, degree = 2) + poly(var2, degree = 2)+...poly(var15, degree = 2)

y ~ poly(var1, var2, var3, ....var15, degree = 2) 将等同于上述表达式。

poly(var1, degree = 2) 相当于 var1 + I(var1^2)

要获得三次多项式,请使用degree = 3poly()中的I(var1^3)

使用polyI(var, 2)有一个警告,在拟合模型之后,它们中的每一个都会产生不同的系数,但拟合的值是等价的,因为它们代表了不同的参数化。同一型号。建议使用I(var, 2)而不是poly(),以避免在poly()中看到的摘要效果。

总之,要获得线性,二次和二阶交互项,您将得到类似

的表达式

<强> y ~ .^2 + I(var1^2) + I(var2^2)+...I(var15^2)

四个变量的演示:

old <- reformulate( 'y ~ x1+x2+x3+x4' )
new <- reformulate( " y ~ .^2 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) ")
tmp <- .Call(stats:::C_updateform, old, new)
tmp
# ~y ~ (x1 + x2 + x3 + x4)^2 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2)
# attr(,".Environment")
# <environment: R_GlobalEnv>

terms.formula(tmp, simplify = TRUE )

# ~y ~ x1 + x2 + x3 + x4 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) + 
#   x1:x2 + x1:x3 + x1:x4 + x2:x3 + x2:x4 + x3:x4
# attr(,"variables")
# list(~y, x1, x2, x3, x4, I(x1^2), I(x2^2), I(x3^2), I(x4^2))
# attr(,"factors")
#         x1 x2 x3 x4 I(x1^2) I(x2^2) I(x3^2) I(x4^2) x1:x2 x1:x3 x1:x4 x2:x3 x2:x4 x3:x4
# ~y       0  0  0  0       0       0       0       0     0     0     0     0     0     0
# x1       1  0  0  0       0       0       0       0     1     1     1     0     0     0
# x2       0  1  0  0       0       0       0       0     1     0     0     1     1     0
# x3       0  0  1  0       0       0       0       0     0     1     0     1     0     1
# x4       0  0  0  1       0       0       0       0     0     0     1     0     1     1
# I(x1^2)  0  0  0  0       1       0       0       0     0     0     0     0     0     0
# I(x2^2)  0  0  0  0       0       1       0       0     0     0     0     0     0     0
# I(x3^2)  0  0  0  0       0       0       1       0     0     0     0     0     0     0
# I(x4^2)  0  0  0  0       0       0       0       1     0     0     0     0     0     0
# attr(,"term.labels")
# [1] "x1"      "x2"      "x3"      "x4"      "I(x1^2)" "I(x2^2)" "I(x3^2)" "I(x4^2)"
# [9] "x1:x2"   "x1:x3"   "x1:x4"   "x2:x3"   "x2:x4"   "x3:x4"  
# attr(,"order")
# [1] 1 1 1 1 1 1 1 1 2 2 2 2 2 2
# attr(,"intercept")
# [1] 1
# attr(,"response")
# [1] 1
# attr(,".Environment")
# <environment: R_GlobalEnv>