我有一个数据集,其中我有几个患者,他们的疾病活动状态和特定细菌的丰度如下:
**Patient** **DiseaseActivity** **Bacteria**
15 Severe 0.6704
15 Quiescent 0.0350
24 Quiescent 0.0137
24 Quiescent 0.0088
26 Quiescent 0.0023
26 Severe 0.0410
33 Quiescent 0.2031
33 Quiescent 0.0893
37 Quiescent 0.0345
37 Quiescent 0.0031
52 Quiescent 0.0601
52 Severe 0.0200
53 Severe 0.0050
53 Severe 0.2724
69 Severe 0.9369
69 Quiescent 0.0008
2 Severe 0.0421
2 Quiescent 0.0120
12 Severe 0.3109
12 Severe 0.0646
40 Quiescent 0.8048
40 Severe 0.9113
51 Severe 0.1918
51 Severe 0.9538
每位患者在2个不同的时间点获得两个样本。当我逐一绘制时,我可以看到当疾病严重程度从静止到严重时,细菌的丰度增加或疾病严重程度从严重到静止,细菌的丰度减少,即使只有6名患者适合这种类型的类别。
我的问题是如何检查这6例患者是否确实如此,或者我需要对这类数据进行何种类型的检测?如果我想绘制这些数据,那么绘制数据最准确的方法是什么?
非常感谢您提前。
答案 0 :(得分:0)
我不知道'最准确',我无法帮助您使用哪种测试,这取决于您的受众以及您的数据。但这是一个可能的情节?
change.df <- data.df%>%group_by(Patient)%>%summarize(status.change=paste(DiseaseActivity,collapse=""),bacteria.change=Bacteria[2]-Bacteria[1])
ggplot(change.df,aes(x=bacteria.change,y=status.change,color=status.change))+geom_point(size=5)+theme_bw()
这假设每个患者都有两个时间点,而且他们总是处于时间顺序1:时间2,这非常危险!时间点应该真正记录在自己的专栏中。