我已经安装了StatsModels,现在我试图通过运行他们的example代码进行测试
import numpy as np
import statsmodels.api as sm
import statsmodels.formula.api as smf
^这一切都没有错误
data = sm.datasets.get_rdataset('dietox', 'geepack').data
data.head()
给出
Weight Feed Time Pig Evit Cu Litter
0 26.50000 NaN 1 4601 1 1 1
1 27.59999 5.200005 2 4601 1 1 1
2 36.50000 17.600000 3 4601 1 1 1
3 40.29999 28.500000 4 4601 1 1 1
4 49.09998 45.200001 5 4601 1 1 1
然后
type(data)
返回
pandas.core.frame.DataFrame
和
data.dtypes
给出
Weight float64
Feed float64
Time int64
Pig int64
Evit int64
Cu int64
Litter int64
dtype: object
但是当我尝试使用
制作统计模型时md = smf.mixedlm("Weight ~ Time", data, groups=data["Pig"])
我收到错误
ValueError: For numerical factors, num_columns must be an int
有谁知道这里发生了什么?