我已经使用R一段时间但我现在正在尝试学习一些Python。我试图用Kaggle的Titantic数据集运行一个简单的二项式glm分类。以下是模型本身的代码:
formula = 'Survived ~ Pclass + Gender + AgeFill + Fare'
glm = smf.glm(formula = formula, data = train_data, family = sm.families.Binomial()).fit()
但是当我运行模型时,我收到了这个错误:
IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis
(`None`) and integer or boolean arrays are valid indices
我用pandas DataFrame编辑了模型,但后来将东西转换回numpy数组。模型中的所有内容都是浮点数,没有缺失值。任何帮助将不胜感激。