根据实验室数据计算疾病流行率和性别分布

时间:2017-08-16 00:34:11

标签: database sas bioinformatics medical bigdata

我有几个不同实验室的患者诊断和实验室值的数据集。为了开始探索性分析,我想计算疾病患病率并对该组中的每种疾病进行性别卡方检,以获得实验室的正值。问题在于诊断和实验室值在不同的行上。

这是数据的示例:

ID  n_lab1  units_lab1  upperlim_lab1   diagnosis   gender  age
1   0.5 nmol/L  0.2 celiac  M   31
1   0.5 nmol/L  0.2 RA  M   31
1   0.5 nmol/L  0.2 Lupus   M   31
1   0.5 nmol/L  0.2 Vitiligo    M   31
1   0.5 nmol/L  0.2 Crohn's M   31
2   0.8 nmol/L  0.2 Uveitis F   52
2   0.8 nmol/L  0.2 RA  F   52
2   0.8 nmol/L  0.2 alopecia    F   52
3   1.5 U/mL    1   hypothyroid F   69
3   1.5 U/mL    1   celiac  F   69
3   1.5 U/mL    1   vitiligo    F   69
3   1.5 U/mL    1   RA  F   69
3   1.5 U/mL    1   scleroderma F   69

每位患者的诊断都列在不同的行上。

包含标准代码看起来像这样。

IF units_lab1 = "nmol/L" AND upperlim_lab1 = 0.2 AND n_lab1 GE 0.2;
IF units_lab1 = "U/mL" AND upperlim_lab1 = 1 AND n_lab1 GE 1.5;

如果数据看起来像这样,我将如何计算乳糜泻患病率,然后计算RA等,并计算性别分布并用PROC FREQ进行卡方检验; tables / chisq;

0 个答案:

没有答案