我正在练习Fresco Play中使用Python进行的Poissons Stats回归练习。 问题陈述如下: 从MASS包中加载R数据集保险。 将数据捕获为熊猫数据框。 用自变量的对数建立泊松回归模型 持有人和因变量Claims。 用数据拟合模型,找到残差之和。
我停留在最后一行,即剩余总和
我使用了np.sum(model.resid)
。但是答案不被接受
这是我的代码
import statsmodels.api as sm
import statsmodels.formula.api as smf
import numpy as np
INS_data = sm.datasets.get_rdataset('Insurance','MASS').data
model = smf.poisson('Claims ~ np.log(Holders)', INS_data).fit()
print(np.sum(model.resid))
答案 0 :(得分:0)
我在Python2中运行的代码给出了错误的答案,但在Python3中运行了给出了正确的答案。我不知道原因,但是代码可以在Python3中完美运行
答案 1 :(得分:0)
对于残差,您可以使用残差的基本概念,即实际-预测。
这是代码段。
import statsmodels.api as sm
import numpy as np
import statsmodels.formula.api as smf
Insurance = sm.datasets.get_rdataset('Insurance','MASS')
data = Insurance.data
data['Holders_'] = np.log(data['Holders'])
model = smf.poisson('Claims ~ Holders_',data).fit()
y_predicted = p.predict(data['Holders_'])
residual = (data['Claims']-y_predicted)
print(sum(residual))
答案 2 :(得分:-1)
经过大量的搜索之后,我知道它期望累积的总和,所以使用 np.cumsum(model.resid) 它将在Frescoplay中通过