我有几个不同实验室的患者诊断和实验室值的数据集。为了开始探索性分析,我想计算疾病患病率并对该组中的每种疾病进行性别卡方检,以获得实验室的正值。问题在于诊断和实验室值在不同的行上。
这是数据的示例:
ID n_lab1 units_lab1 upperlim_lab1 diagnosis gender age
1 0.5 nmol/L 0.2 celiac M 31
1 0.5 nmol/L 0.2 RA M 31
1 0.5 nmol/L 0.2 Lupus M 31
1 0.5 nmol/L 0.2 Vitiligo M 31
1 0.5 nmol/L 0.2 Crohn's M 31
2 0.8 nmol/L 0.2 Uveitis F 52
2 0.8 nmol/L 0.2 RA F 52
2 0.8 nmol/L 0.2 alopecia F 52
3 1.5 U/mL 1 hypothyroid F 69
3 1.5 U/mL 1 celiac F 69
3 1.5 U/mL 1 vitiligo F 69
3 1.5 U/mL 1 RA F 69
3 1.5 U/mL 1 scleroderma F 69
每位患者的诊断都列在不同的行上。
包含标准代码看起来像这样。
IF units_lab1 = "nmol/L" AND upperlim_lab1 = 0.2 AND n_lab1 GE 0.2;
IF units_lab1 = "U/mL" AND upperlim_lab1 = 1 AND n_lab1 GE 1.5;
如果数据看起来像这样,我将如何计算乳糜泻患病率,然后计算RA等,并计算性别分布并用PROC FREQ进行卡方检验; tables / chisq;