在Python Statsmodels中创建文件OLS

时间:2018-01-10 11:31:41

标签: python pandas

我对Python没有太多的了解,但我必须将其解析为评估完成,

问题:
运行以下代码以加载所需的库并创建适合模型的数据集。

from sklearn.datasets import load_boston
import pandas as pd 

boston = load_boston()
dataset = pd.DataFrame(boston.data, columns=boston.feature_names)
dataset['target'] = boston.target

print(dataset.head())

我必须执行以下步骤才能完成此方案。

对于上面代码片段中加载的boston数据集,执行线性回归 使用目标变量作为因变量 使用RM变量作为自变量 在python中使用statsmodels包拟合单个线性回归模型 在代码中适当地导入statsmodels包 在拟合模型后,识别系数 最后在代码中打印模型摘要 您可以使用vim app.py编写代码。

按i进入插入模式 按esc然后:wq保存并退出编辑器。

请帮助我了解如何完成此操作。非常感谢您的宝贵意见

先谢谢

1 个答案:

答案 0 :(得分:1)

from sklearn.datasets import load_boston
import pandas as pd 

boston = load_boston()
dataset = pd.DataFrame(boston.data, columns=boston.feature_names)
dataset['target'] = boston.target

print(dataset.head())

import statsmodels.api as sm
import statsmodels.formula.api as smf

X = dataset["RM"]
y = dataset['target']

X = sm.add_constant(X)

model = smf.OLS(y,X).fit()

predictions = model.predict(X)

print(model.summary())