我有一个不平衡的面板数据集。我创建了一个池化模型,现在需要预测并输入数据集的缺失值。怎么做到呢? 这是我的数据的打印屏幕:https://imagizer.imageshack.us/v2/1366x440q90/661/RAH3uh.jpg 谢谢!
答案 0 :(得分:0)
首先,看起来你在这里有一个太广泛的问题。如果您真的在询问如何预测电子表格的值(即单元格:Z6,AA6,...,AM22,...);是的,你有一个巨大的问题=]。只需提示一下,在以下问题中,您应该更加具体,例如:我在白俄罗斯中拥有与家庭相关的数据。我搜索了关于预测模型的信息并尝试了 XPTO1 和 XPTO2 。我怎样才能决定哪一个更好?
所以,我在这里真正的意思是预测不是像SUM这样的函数,你可以应用于你的数据。预测是一个完整的学科,有一堆方法应该针对不同的情况进行测试。例如,要预测数据中的Z6单元格,您应该问问自己其他数据可以用来推断数据缺失信息?在某些情况下,过去5年的简单平均值就足够了,在其他一些情况下,还应考虑更多。
我建议你先看看一些涵盖简单模型的基本材料,比如线性模型,玩它们,尝试理解获得的预测的准确性......这最终会解决你的问题,或者至少会帮助您向社区提出更多“回答”问题。
最后一个提示:有一个新的SO姐妹Q& A社区可能更适合询问有关预测模型的问题:https://datascience.stackexchange.com/
祝你好运。