如何处理具有“时间段”和丢失数据的数据集

时间:2018-11-23 07:59:31

标签: dataset regression cluster-computing data-analysis missing-data

我正在处理一个数据集,该数据集以时间点(例如8月,9月等)为列,并以行的形式收集了该点的不同测量值。
除此之外,数据根本不是干净的,有很多丢失的数据,我只是不能将所有行都丢弃或填充它们,所以我的想法是将数据集分成4个较小的行。 /> 可以对此类数据集执行哪种分析?我应该反转列和行吗?

1 个答案:

答案 0 :(得分:1)

缺少数据的时间序列回归是统计分析中的一种特殊情况。简单地重新设置数据集并不是解决方案。

我了解可以通过周期性分析和频谱分析来确定最佳拟合的正弦曲线,即正弦波穿过缺失的数据点,而回归分析是识别与现有数据拟合的一种方法。

以前在基于ARIMA(移动平均值)的统计信息交换中曾提出过同样的问题。就个人而言,我不会对此方法感到厌烦,因为将有一个专业的解决方案。 https://stats.stackexchange.com/questions/121414/how-do-i-handle-nonexistent-or-missing-data