如何在Python中指定要回归的特定列值?

时间:2017-04-02 23:01:39

标签: python

我正在使用Python进行一些线性回归。我有一个相当大的数据文件我正在使用,其中一个我正在看的标题是"男性"这表明一个主题的性别。列值可以是1 =男性,0 =女性。 " rgroupx"是治疗变量(0 =对照,6 =高状态治疗)和" log_mm"是结果变量。

我需要回答的一个问题是:高地位治疗对男性驾驶员干预后的交通违规数量有多大影响?对女性司机有显着的治疗效果吗?

我的目前Python语句之下。我的问题是两个问题,我如何指定要包含在回归中的列值?如果问题是要求男性司机,我怎么告诉Python只包含1?提前谢谢!

model3 = smf.ols('log_mm ~ rgroupx + male', data=Traffic).fit()

1 个答案:

答案 0 :(得分:1)

如果您的数据结构在数据框中,而不是索引和丢弃数据的组合,同时将其分配给新变量“男性”将起作用。

示例:

males_df = data.drop(data[data.gender != 1].index)

回归变量:

males = males_df.gender