首先,我对标题感到抱歉......一旦有人回答它并且我明白我的实际问题是什么,我会把它放得更好。
我正在创建一个事实表,用于衡量与学校相关的资源数量:
学校数量
学生数量
员工数量
计算机数量(供行政用途和学生使用)
FACT_SCHOOL_RESOURCES
学校(FK)
位置(FK)
教育类型(FK)
Total_Schools *
Total_Students
Total_Employees
Total_Students_Computers
Total_Administration_Computers
*在学校数量上,每一行都有相同的值(1)。
我的问题是,有一些与学校有关的“基础设施”问题,我实际上无法将其作为其属性之一(属性名为“基础设施”),因为有多种类型(能源来源) ,Water Source,Waste Disposal ......)我不能将每种类型用作属性,因为对于每种类型,我与我的学校维度有多对多的关系,例如:
电源
太阳能电池板
发电机
城市能源供应
...
废物处置
垃圾填埋场
焚烧
回收
堆肥
废物转化为能源
...
使用这些例子,学校既可以使用垃圾填埋场也可以使用垃圾填埋场,也可以使用城市能源供应,同时使用发电机或太阳能电池板。
所有这一切都是必要的,因为研究表明其中一些问题(以及我未提及的许多其他问题)与“教学质量”有关,应该有办法对其进行分析。
在星型模式中解决此问题的最佳方法是什么?有可能吗?
答案 0 :(得分:2)
我认为你正在寻找超越星型模式的东西。如果您想对哪些因素与某些指标(例如教学质量)最密切相关进行一些多变量分析,那么您可能需要考虑一个多维数据集。
将每种类型的电源和废物处理的存在视为属性。也许你可以从每个因素的二进制标志这样简单的东西开始。然后,您可以使用多维数据集中的不同切片测试指标与因子之间的相关性。