我需要在R中拟合线性SVM,其具有一个特征作为响应,并且模型中的每个其他特征的线性二次和交互项作为预测器。 是否有一个函数可以帮助计算其他预测变量的线性,二次和交互项(大约15个单独的预测变量)
答案 0 :(得分:2)
y ~ .
:此处.
被解释为在拟合模型时使用的数据框中除y
之外的所有变量。它相当于预测变量的线性组合。例如y ~ var1 + var2 + var3+...+var15
y ~ . ^ 2
将给出数据框中变量的所有线性(主效应)和二阶交互项。它相当于y ~ var1 + var2 + ...+var15 + var1:var2 + var1:var3 + var1:var4...and so on
y ~ var1 + var2 + ...+var15 + I(var1^2) + I(var2^2) + I(var3^2)...+I(var15^2)
:这里我(var ^ 2)表示数据框中一个变量的二次多项式。
<强> y ~ poly(var1, degree = 2) + poly(var2, degree = 2)+...poly(var15, degree = 2)
强>
或
y ~ poly(var1, var2, var3, ....var15, degree = 2)
将等同于上述表达式。
poly(var1, degree = 2)
相当于 var1 + I(var1^2)
。
要获得三次多项式,请使用degree = 3
或poly()
中的I(var1^3)
。
使用poly
与I(var, 2)
有一个警告,在拟合模型之后,它们中的每一个都会产生不同的系数,但拟合的值是等价的,因为它们代表了不同的参数化。同一型号。建议使用I(var, 2)
而不是poly()
,以避免在poly()
中看到的摘要效果。
总之,要获得线性,二次和二阶交互项,您将得到类似
的表达式 <强> y ~ .^2 + I(var1^2) + I(var2^2)+...I(var15^2)
强>
四个变量的演示:
old <- reformulate( 'y ~ x1+x2+x3+x4' )
new <- reformulate( " y ~ .^2 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) ")
tmp <- .Call(stats:::C_updateform, old, new)
tmp
# ~y ~ (x1 + x2 + x3 + x4)^2 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2)
# attr(,".Environment")
# <environment: R_GlobalEnv>
terms.formula(tmp, simplify = TRUE )
# ~y ~ x1 + x2 + x3 + x4 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) +
# x1:x2 + x1:x3 + x1:x4 + x2:x3 + x2:x4 + x3:x4
# attr(,"variables")
# list(~y, x1, x2, x3, x4, I(x1^2), I(x2^2), I(x3^2), I(x4^2))
# attr(,"factors")
# x1 x2 x3 x4 I(x1^2) I(x2^2) I(x3^2) I(x4^2) x1:x2 x1:x3 x1:x4 x2:x3 x2:x4 x3:x4
# ~y 0 0 0 0 0 0 0 0 0 0 0 0 0 0
# x1 1 0 0 0 0 0 0 0 1 1 1 0 0 0
# x2 0 1 0 0 0 0 0 0 1 0 0 1 1 0
# x3 0 0 1 0 0 0 0 0 0 1 0 1 0 1
# x4 0 0 0 1 0 0 0 0 0 0 1 0 1 1
# I(x1^2) 0 0 0 0 1 0 0 0 0 0 0 0 0 0
# I(x2^2) 0 0 0 0 0 1 0 0 0 0 0 0 0 0
# I(x3^2) 0 0 0 0 0 0 1 0 0 0 0 0 0 0
# I(x4^2) 0 0 0 0 0 0 0 1 0 0 0 0 0 0
# attr(,"term.labels")
# [1] "x1" "x2" "x3" "x4" "I(x1^2)" "I(x2^2)" "I(x3^2)" "I(x4^2)"
# [9] "x1:x2" "x1:x3" "x1:x4" "x2:x3" "x2:x4" "x3:x4"
# attr(,"order")
# [1] 1 1 1 1 1 1 1 1 2 2 2 2 2 2
# attr(,"intercept")
# [1] 1
# attr(,"response")
# [1] 1
# attr(,".Environment")
# <environment: R_GlobalEnv>