基于GoodData对实现Fact表的出色建议,我已经能够设计一个满足客户要求的模型,以便在不同的表中连接不同的属性。我现在面临的问题是模型指标高度非规范化,数据重复。我目前正试图找出一种重复数据删除结果的方法。
例如,我有两个表 - 第一个是NAMES表,第二个是我的事实表:
NAMES
Val2名称
35约翰
36比尔
37莎莉
FACT
VAL1 VAL2 SCORE COURSEGRADE
1 35 50 90%
2 35 50 80%
3 35 50 60%
4 36 10 75%
5 37 40 95%
我要做的是以这样的方式编写度量标准,以便我们可以获得消除重复值的SCORE平均值。 GoodData非常出色,它实际上可以使用COUNT(VARIABLE1,RECORD)指标给我回复独特的结果,但是在消除突破信息时我似乎无法让普通商店坚持下去。如果我保留所有字段(包括VAL2),它会向我展示一切:
VAL2 SCORE(AVG)
35 50
36 10
37 40
AVG:33.33
但是当我删除VAL2时,我突然失去了记录的“唯一性”。
SCORE(AVG)
40
我想要的是我们得到的33.33分。
我尝试在SELECT AVG(SCORE)中使用BY语句,但这似乎不起作用。这几乎就像我需要某种DISTINCT子句。关于如何获得上面第一个例子中显示的汇总值的任何想法?
答案 0 :(得分:3)
很高兴在这里提供帮助。我会尝试以下方法:
创建一个中间指标(让我们称之为员工得分):
按所有其他尺寸选择所有MIN(分数)
然后,一旦您定义了此指标,您就应该能够为平均分数创建一个指标,如下所示:
SELECT AVG(按员工分数)
我们创建第一个度量标准的原因是强制表在ID属性周围标准化得分,当我们在下一个度量标准中使用它时,除去重复项(我们也可以使用MAX或AVG,它没有'无所谓)。 希望这可以解决您的问题,如果它不起作用,请告诉我,我会很乐意提供更多帮助。另外,请随时查看GoodData的Developer Portal,了解有关报告的更多信息:
https://developer.gooddata.com/docs/reporting
最佳,
JT
答案 1 :(得分:1)
您绝对应该检查由Petr Olmer(http://www.slideshare.net/petrolmer/in10-how-to-build-a-metric-in-a-metric)制作的“如何在度量标准中构建指标”演示文稿。
它可以帮助您更好地理解它。
干杯,
彼得