(我的实际数据是别的东西,但我不允许分享。这个解释是我的数据的近似值。我希望你能帮助我解决我的数据处理问题,无论数据类型如何)。>
假设我有一个包含 10.000 个气象站的数据集。
每个气象站每小时测量一次温度。
在夜间它是低的,虽然有一点噪音。白天,温度更高。气象站分布在一个很大的区域,因此当一个地方和另一个地方的太阳升起时,可能会有几个小时的差异。
我需要找出每个地方的太阳何时升起(或温度升高)和太阳何时落下。
这很大程度上取决于每年的季节。但一开始,我平均可以使用 2 周以上。
有没有办法确定这样的时间序列中增加的开始时间和减少的结束时间?
我曾尝试对数据进行聚类,但噪音太大,无法根据这些开始和结束时间进行聚类。
感谢任何输入