在星型模式中建模图表数据

时间:2017-02-19 11:44:04

标签: data-warehouse olap-cube star-schema

我有兴趣在数据仓库中存储x和y表格(图表)中的科学数据,其中x和y都是实数。

将为一组固定的描述性维度(例如时间,日期,地点,设备)生成每个图表,这些维度可以在传统的星形/雪花模式中建模。

一个例子是探测器的角度与响应,其中角度是自变量,响应是相关的。这里的角度可以是0到360度之间的任何实数。

我目前的想法是使用实​​际值作为维度,可能以适当的比例(例如3dp)预先填充0到360之间的angle_dimension表,并在必要时舍入测量结果,尽管这会导致丢失精度。

我想知道是否有更有效的方法来存储此数据以供以后在OLAP多维数据集中使用? 我要做的查询类型是比较不同时间点的图表数据,以查找变化或查看不同位置或不同设备的给定范围(比如0-15度)的平均响应。

1 个答案:

答案 0 :(得分:0)

你的最后一段给出了我想要如何存储它进行分析的一个很好的提示:按时间,按角度范围,按位置,按设备 - 所有这些都是尺寸。

对此进行建模的一种方法可能是将事实的粒度视为“每个绘图点一行”,其中有2个真实数字,不会失去精度。

然后,您可以按照您的说法添加辅助尺寸以对数字进行分类。在角度示例中,您还可以将“角度范围”显示为显示0-15,16-30等的列

如果您有更多的角度和响应,可能需要更复杂/通用的设计,通用尺寸为“X轴类型”,包括范围,但附加的“X轴类型”列是'角度','回应'等。

我认为你的广泛想法是合理的,现成的工具应该没有细节和摘要。关键是模拟某些东西,既反映了您正在测量的东西的基本性质(即机器中的阅读)以及人们想要如何分析它。您可能希望使用多维数据集的功能来提供平均值的计算,而不是让底层维度模型处理它。