标签: r data-cleaning outliers longitudinal
我有一个包含5,000条记录的数据集,每条记录都包含了不同时间十年内收集的一系列连续测量数据。每个测量最初都是手动输入的,正如可能预期的那样,有许多错误需要纠正。
通常,不正确的数据在点到点之间变化> 50%,而正确的数据在任何时候最多变化10%。如果我单独可视化数据,这些在X / Y图中非常明显,在X轴上有时间。
单独绘制每个图表是不可行的,我试图弄清楚是否有更快的方法来自动化和标记明显错误且需要纠正/删除的数据。
有没有人遇到过像这样的问题?