我正在尝试从statsmodels
生成的结果中访问变量的名称。我将在示例代码之后详细说明。
import scikits.statsmodels.api as sm
import pandas as pd
data = sm.datasets.longley.load()
df = pd.DataFrame(data.exog, columns=data.exog_name)
y = data.endog
df['intercept'] = 1.
olsresult = sm.OLS(y, df).fit()
此摘要输出包含变量名称。当您调用类似olsresult.params的内容时,它会返回以下内容:
In [21]: olsresult.params
Out[21]:
GNPDEFL 15.061872
GNP -0.035819
UNEMP -2.020230
ARMED -1.033227
POP -0.051104
YEAR 1829.151465
intercept -3482258.634596
现在我好奇的是创建类似字典的东西,其中变量名称作为键,参数值作为值。所以,像{'GNPDELF':15.0618, 'GNP':-0.035819}
之类的东西,等等。如果不可能这样做,是否有其他方法可以单独访问变量名称和值?
答案 0 :(得分:5)
总是值得尝试显而易见的......:^)
In [14]: olsresult.params
Out[14]:
GNPDEFL 15.061872
GNP -0.035819
UNEMP -2.020230
ARMED -1.033227
POP -0.051104
YEAR 1829.151465
intercept -3482258.634597
In [15]: dict(olsresult.params)
Out[15]:
{'ARMED': -1.0332268671737328,
'GNP': -0.035819179292614578,
'GNPDEFL': 15.061872271452557,
'POP': -0.051104105653539733,
'UNEMP': -2.0202298038172479,
'YEAR': 1829.151464613984,
'intercept': -3482258.6345966831}
另请参阅.to_dict()
对象的Series
方法。
答案 1 :(得分:4)
olsresult.params
是一个pandas.Series对象,类似于,也许你不需要转换成字典。
In [12]: olsresult.params.get('GNP')
Out[12]: -0.035819179292566283
In [13]: olsresult.params['GNP']
Out[13]: -0.035819179292566283
In [14]: for key, value in olsresult.params.iteritems():
....: print key, value
....:
GNPDEFL 15.0618722714
GNP -0.0358191792926
UNEMP -2.02022980382
ARMED -1.03322686717
POP -0.0511041056537
YEAR 1829.15146461
intercept -3482258.6346