量化时间线数据以进行平均和直方图

时间:2016-12-10 17:43:44

标签: google-sheets spreadsheet

我有一些原始电子表格数据,格式如下:

12/7/2016 3:07:00, 88.05,
12/7/2016 3:08:00, 89.10,
12/7/2016 3:13:00, 87.00,
etc

这些数据点不会定期采样,而是全天随机收集。

在Google文档中使用Google Spreadsheets,我可以轻松地将其绘制到时间轴图表上。这会将值放在时间轴上的正确位置,并将不均匀的采样间隔考虑在内。

我想生成时间轴数据的直方图,同时考虑时间戳并计算一段时间内的平均值。我相信如果我只是通过内置的直方图表运行它或者选择我的数据值并通过平均函数运行它,它将会因不均匀的采样间隔而出现偏差。

为了生成直方图和平均值,量化采样间隔(理想情况是在Google表格中)的最简单方法是什么?或者,是否有内置的方法来生成直方图/值的平均值,同时考虑时间戳数据,从而消除了对量化数据的需求?

1 个答案:

答案 0 :(得分:1)

您可以按如下方式计算适当的平均值(假设您的数据在A2:B50范围内)

=sum(arrayformula((A3:A50-A2:A49)*(B3:B50+B2:B49)/2))/(A50-A2)

此公式实现Trapezoidal rule:分配给每个时间间隔的值是该间隔末尾的观察值的平均值。

没有内置的“加权直方图”工具,因此似乎需要重新采样以创建代表性直方图。这是重新取样的一种方法。假设你想要20个样本;然后在C2中输入

=arrayformula(A2+(row(1:20)-1)*(A50-A2)/19)

获得20个均匀分布的时间值。 (由于围栏的区别,因此除以19。)然后在D2中,

=arrayformula(vlookup(C2:C21, A2:B50, 2))

将为每个采样时间查找一个值。然后,您可以从D列构建直方图。