我应该使用哪种统计模型/方法?

时间:2015-10-28 14:26:06

标签: sas

我在新泽西州收集了一些数据,这些单位是嵌套在四个城市的个人。 在四个城市中,还有三种类型的社区由某人定义。

我试图看看在各个城市控制某些个别水平变量的dep var(例如,每周不止一次在快餐店吃饭)是否有任何差异。

我正在运行一个二进制logit模型来控制城市级别的集群。我在SAS中使用了Proc Genmod。

我的问题是,当我在城市一级控制聚类时,是否包含城市的虚拟变量是否有意义?

proc genmod data=njcob.foranalysis;
    class cityid; /* <= ID for four cities*/
    model ffwk1ormore=
    city1 city2 /* <= not sure about this part */
    male age6and11 age12and19 black hispanic fgnborn highsch more_highsch povlevel / dist=bin; 
    repeated subject=cityid / type=ind; 
run;

还是有更好的模特? 我很感激任何建议!谢谢。

1 个答案:

答案 0 :(得分:0)

如果我理解得很好,你想按城市做模特。 (在这种情况下,您假设每个城市之间存在差异)

如果添加虚拟变量city,它对于每个模型都是常量,因此保留它们不是最佳做法。

如果您想知道是否存在效果“城市”,您可以将模型中的城市作为因变量(作为因子或虚拟变量)制作一个模型,并检查参数是否重要。