我正在采样一个更大的数据集,以适应和预测statsmodels GLM模型。
根据示例,运行model.predict
将省略它返回的数组中的一些小数(< 10)记录。我假设它在处理数据集中的少量行时遇到一些错误。
例如,如果我预测使用行15000:20000,则返回的数组的形状将为4994,或4997,或类似的东西。
这很痛苦,因为我无法分辨哪些行被省略,我想在整个数据帧上运行.predict函数,然后轻松地将预测值添加为新列。
有人(a)知道发生了什么以及如何解决它,或者(b)有一个很好的方法可以根据索引将预测值添加回数据帧吗?