如果数据集中没有Statsmodels OLS'inf or NaN'错误

时间:2018-11-26 21:09:31

标签: python pandas statistics statsmodels anova

我的数据如下:

58.445355   97.668693   126.101506  192.417611  221.809156  289.785785  t0  x5
60.451638   101.626297  130.027950  191.922363  219.977219  296.777197  11  x88
61.961283   104.692036  132.872274  197.605787  225.731945  313.789832  t2  x4

列为num1num6,然后依次为tx

import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm

formula = 'num4 ~ C(t) + C(x) + C(t):C(x)'
model = ols(formula, data).fit()

aov_table = sm.stats.anova_lm(model, typ=2)

这导致此错误

ValueError: array must not contain infs or NaNs

尽管我的数据框没有Infs或NAN。

我在做什么错了?

PS 。我已经成功地使用R中的aov函数进行了准确的分析,而没有遇到任何问题。

诊断

data.isnull().sum()

num1            0
num2            0
num3            0
num4            0
num5            0
num6            0
t               0
x               0
dtype: int64

0 个答案:

没有答案