我有一个带有目标和200多个独立变量的数据集,并且运行了一个自动线性回归来确定可解释的因子,这些因素可以解释70-80%的差异。
我现在需要做的是通过数据运行该功能,并查看每行的预测值。由于有四十多个因素,我不想通过数据集中的公式进行转换。
有没有办法将回归公式应用于数据集?
答案 0 :(得分:0)
是的,在def create_new_row_r(json_dict):
newdata = robjects.r('''
createdata = function(row){
dummydata <- row
dummydata["field1"] <- %s
dummydata["field2"] <- %s
dummydata["field3"] <- %i
dummydata["field4"] <- %s
dummydata["field5"] <- %i
dummydata["field6"] <- %s
dummydata["field7"] <- %i
dummydata["field8"] <- %i
dummydata["field8"] <- %i
dummydata["field9"] <- %i
dummydata["field10"] <- %i
dummydata["field11"] <- %i
return(dummydata)
}
createdata(datz1[1,])
'''
%(json_dict["field1"], json_dict["field2"], json_dict["field3"],
json_dict["field4"], json_dict["field5"],
json_dict["field6"], json_dict["field7"], json_dict["field8"],
json_dict["field9"], json_dict["field10"],
json_dict["field11"], json_dict["field12"]))
print "new row assembled"
return newdata
命令中,可以选择保存预测分数。因此,在运行回归模型时,它还应同时将模型公式应用于案例。
答案 1 :(得分:0)
问题表明使用ALM(自动建模)而不是标准回归命令。但是标准回归和ALM都允许您保存模型(在ALM的“模型选项”选项卡上)。然后你可以使用Utilities&gt;评分向导将模型应用于原始数据或其他数据集。