如何在R为中心点的阶乘实验(2 ^ k)中预测值?

时间:2018-06-27 21:50:15

标签: r regression prediction

我如何使用带有FrF2函数的predict包或broom包来预测R中的中心点的阶乘实验中的值?

我的代码:

library(FrF2)
plan.person = FrF2(nfactors = 5, resolution = 5, replications = 2,
               ncenter = 1, randomize = FALSE,
               factor.names = list(
                 A = c(8, 5),
                 B = c(70, 30),
                 C = c(0.5, 0),
                 D = c(1000, 700),
                 E = c(70, 10)))

resp  <- c(84.55, 66.34, -1, 69.18, 73.01, 64.52, 0.73, 47.61, 68.18, 59.87, 
       26, 72.57, 78.08, 73.81, 26, 59.38, 71.41, 88.64, 64.92, 4, 68.81, 
       80, 69.66, -1.36, 54.50, 79.24, 78.53, -1, 72.63, 89.97, 87.98, 
       -11, 65.68, 82.46)

newplan <- add.response(design = plan.person, response = resp)

model <- lm(newplan, use.center = T)
# summary(model)

d <- within(newplan, {
  A <- as.numeric(as.character(A))
  B <- as.numeric(as.character(B))
  C <- as.numeric(as.character(C))
  D <- as.numeric(as.character(D))
  E <- as.numeric(as.character(E)) })

A = seq(5, 8, 1)
B = seq(30, 70, length.out = length(A))
C = seq(0, 0.5, length.out = length(A))
D = seq(700, 1000, length.out = length(A))
E = seq(10, 70, length.out = length(A))

data <- expand.grid(A = A, B = B,
                C = C, D = D,
                E = E)  

dados$p <- predict(model, newdata=data)

由于中心点,出现以下消息。

  

model.frame.default中的错误(术语,newdata,na.action = na.action,xlev = object $ xlevels):   变量的长度不同(位于“中心”)

2 个答案:

答案 0 :(得分:3)

“具有中心点的二级实验可以检测但不能拟合二次效应。” (https://www.itl.nist.gov/div898/handbook/pri/section3/pri336.htm

也就是说,R无法预测这些值,因为您需要对曲线的外观做出其他假设,以预测不在设计点处的点。

请注意,通过计算,您可以通过添加center来使软件正常工作。错误是因为该术语在回归中,而不在数据集中。您可以添加一个data$center <- FALSE(因为data中的所有点都不在中心),但这将做正确的事情,因为它不会占用在预测非中心点时考虑到潜在的曲率,它将简单地预测在中心具有单个凸点的扭曲平面(即与相互作用成线性关系)。

当然,这也等同于仅用use.center=FALSE拟合模型,因为中心点不会影响其他点的拟合。

答案 1 :(得分:0)

如果删除中心值,则可以在model <- lm(newplan, use.center = T) 之后:

1-过滤p值<0.05

coe <- broom::tidy(model) %>% 
  slice(-7) %>%   #remove center
  filter(p.value < 0.05)   

m_beta <- coe$estimate

2-做网格:

A = seq(5, 8, 0.5)
B = seq(30, 70, length.out = length(A))

exp <- expand.grid(A = A, B = B) %>% 
  mutate(bo = as.numeric(1)) %>% 
  mutate(ult = A*B) %>% 
  select(bo, A, B, ult) %>% 
  as.matrix()

3:进行回归:

reg <- t(m_beta %*% t(exp)) 

exp <- cbind(exp, reg) %>% 
  as.data.frame() %>% 
  rename(reg = V5)

但是我相信这只能解决或简化计算问题。我相信线性回归也应该重做。但是使用此代码,您可以探索并查看存在其他错误。