Question

我正在尝试从statsmodels生成的结果中访问变量的名称。我将在示例代码之后详细说明。

import scikits.statsmodels.api as sm
import pandas as pd
data = sm.datasets.longley.load()
df = pd.DataFrame(data.exog, columns=data.exog_name)
y = data.endog
df['intercept'] = 1.
olsresult = sm.OLS(y, df).fit()

此摘要输出包含变量名称。当您调用类似olsresult.params的内容时，它会返回以下内容：

In [21]: olsresult.params
Out[21]: 
GNPDEFL           15.061872
GNP               -0.035819
UNEMP             -2.020230
ARMED             -1.033227
POP               -0.051104
YEAR            1829.151465
intercept   -3482258.634596

现在我好奇的是创建类似字典的东西，其中变量名称作为键，参数值作为值。所以，像{'GNPDELF':15.0618, 'GNP':-0.035819}之类的东西，等等。如果不可能这样做，是否有其他方法可以单独访问变量名称和值？

Answer 1

总是值得尝试显而易见的......：^）

In [14]: olsresult.params
Out[14]: 
GNPDEFL           15.061872
GNP               -0.035819
UNEMP             -2.020230
ARMED             -1.033227
POP               -0.051104
YEAR            1829.151465
intercept   -3482258.634597

In [15]: dict(olsresult.params)
Out[15]: 
{'ARMED': -1.0332268671737328,
 'GNP': -0.035819179292614578,
 'GNPDEFL': 15.061872271452557,
 'POP': -0.051104105653539733,
 'UNEMP': -2.0202298038172479,
 'YEAR': 1829.151464613984,
 'intercept': -3482258.6345966831}

另请参阅.to_dict()对象的Series方法。

Answer 2

olsresult.params是一个pandas.Series对象，类似于，也许你不需要转换成字典。

In [12]: olsresult.params.get('GNP')
Out[12]: -0.035819179292566283

In [13]: olsresult.params['GNP']
Out[13]: -0.035819179292566283

In [14]: for key, value in olsresult.params.iteritems():
   ....:     print key, value
   ....:
GNPDEFL 15.0618722714
GNP -0.0358191792926
UNEMP -2.02022980382
ARMED -1.03322686717
POP -0.0511041056537
YEAR 1829.15146461
intercept -3482258.6346

使用pandas和statsmodels时拉取变量名称

2 个答案: