我们可以将离散变量视为回归中的连续变量作为协变量之一

时间:2018-04-19 19:54:05

标签: variables statistics

例如,当我们进行回归时,我们可以将急诊室就诊次数视为连续变量吗?

1 个答案:

答案 0 :(得分:0)

通常,将离散数值变量视为等效于连续变量是有风险的。如果您的离散变量表示某种分类信息(例如红色/蓝色/绿色),尤其如此,除非类别具有一些自然的一维排序(例如,分组为10年波段的年龄),并且代表不同的数字在某种意义上,类别在映射到连续空间时是适当间隔的。

在您的情况下,如果离散变量是患者就诊次数,则将其视为连续变量可能更为合理,特别是如果这些计数往往很大。在这种情况下,假设计数类似于从高斯分布中得出的随机数(遵循Central Limit定理)可能更合理,这可能与流行回归算法的基本统计假设很吻合。但是,如果计数较小,或具有较高的异常值概率,则将它们视为连续变量可能更具风险。