我是R新手 做我的第一个预测案例
我正在使用此站点的能源数据
http://archive.ics.uci.edu/ml/datasets/Energy+efficiency#
我将数据加载到SQL Server表中
问题是,当我使用这些因素(Surface, Wall, and Roof)
我收到此警告
Warning message:
In predict.lm(lr_learn, Pred_Data) :
prediction from a rank-deficient fit may be misleading
如果我将其中任意两个与其他因素一起使用,我会得到结果
当我单独使用这三个因素或与其他因素一起使用时,我会得到警告
我不知道为什么,不知道有人可以帮助我了解发生了什么事情
这是我的代码
library("RODBC")
con <- odbcConnect("SQLServer")
TData <- sqlQuery(con,"select * from energy where id % 10 <> 0")
PData <- sqlQuery(con,"select * from energy where id % 10 = 0")
Test_Data <- data.frame(Surface=TData$Surface, Wall=TData$Wall, Roof=TData$Roof, HeatingLoad=TData$HeatingLoad)
Pred_Data <- data.frame(Surface=PData$Surface, Wall=PData$Wall, Roof=PData$Roof)#, HeatingLoad=PData$HeatingLoad)
lr_learn <- lm(HeatingLoad~., Test_Data)
#Getting warning here
lr_pred <- predict(lr_learn, Pred_Data)
这是三个因素的数据
Surface Wall Roof
--------------------
514.5 294 110.25
563.5 318.5 122.5
588 294 147
612.5 318.5 147
637 343 147
661.5 416.5 122.5
686 245 220.5
710.5 269.5 220.5
735 294 220.5
759.5 318.5 220.5
784 343 220.5
808.5 367.5 220.5