我正在为我的硕士论文写一份研究方案。该研究旨在比较非传染性疾病和风险因素的比率,并确定农村向城市移民的影响。将从农村地区识别兄弟姐妹对。其中一个兄弟姐妹应该参加目前正在该地区进行的农村非传染性疾病调查。其他兄弟姐妹本应该离开该地区,并报告搬到一个城市。数据将通过完成一份关于人口统计,家族史,病史,饮食,饮酒,吸烟,身体活动的问卷收集。这将对农村和城市兄弟姐妹,有关城市地区毛皮时间的数据
二元(无论是否有病症)的结果是:1。糖尿病,2。高血压,3。肥胖
我可以使用什么统计方法来比较两组之间的结果(如上所述),考虑到兄弟姐妹是匹配的(每个农村兄弟姐妹都有一个城市兄弟姐妹)?
还可以使用哪些统计方法来探讨城市居住金额与结果之间的关联?
答案 0 :(得分:0)
鉴于您的主要目标是比较两个名义分布的数量,卡方检验似乎是您第一个问题的首选方法。然而,应该提到的是,卡方检验在某种程度上是用于回答样本差异的“最小”测试。如果您正在学习医学(或相关),卡方检验很好,因为它也经常被该领域的研究人员应用。如果您正在学习心理学或社会学(或相关),我建议在讨论部分强调测试的局限性,因为它主要测试您的分布与随机预期的分布。
关于第二个问题,逻辑回归是适用的,因为它允许二项式分布式变量用于独立变量(预测变量)和因变量。但是,如果您有其他间隔缩放变量(例如年龄,体重等),您还可以使用t检验或ANOVA来研究这些变量之间在特定疾病存在方面的差异(即糖尿病患者与否)。
总的来说,这个问题在很大程度上取决于你所说的“联想”。传统上,“关联”是指相关性或线性回归(对于“双方”,您需要间隔缩放变量)但是根据您的数据结构,上述方法更适合。
您实际计算这些测试的方式取决于所使用的统计软件。