我最近加入了一家医疗保健公司,他们针对每种疾病的每种类型都有各自的数据集市。可以说我有以下三种不同的DM:
我将如何继续将它们集成到一个数据仓库中?
根据我的阅读,这是一个Kimball盗贼。 而且我应该寻找相似的尺寸,并尝试在此基础上构建。
还有其他建议吗?
答案 0 :(得分:0)
您的问题太含糊。在不知道您想对数据仓库做些什么以及数据集市的结构如何的情况下,很难就应该如何进行评论。您可能想退后一步,思考两件事,然后解释:我想做什么?我有什么?
与利益相关者交谈,以解决他们在数据仓库中所拥有的东西。他们想如何使用数据仓库?是用于内部分析还是用于简单的汇总报告?如果是这样,则需要汇总什么样的指标?如果他们在进行复杂的分析,则需要什么样的指标?我建议识别“需求”列表,并对其进行优先排序,以便您可以考虑首先需要交付哪些维度。
之后,仔细研究您拥有的东西。每个疾病数据集市都有什么?有关于疾病的信息吗?分类?有这种病的病人?该疾病做了什么程序?识别数据集市的结构,并列出可从其继承的属性。
在那之后,您可能会就集成方法进行更富有成果的对话。