我想创建多个线图,其中x =年和y =缺失值的比例和“未知”值,然后排列它们(行x列),以便每列对应于特定的人口统计变量和每行对应于特定的病原体。
以下是我的数据示例df
:
PATHOGEN Year Variable Group Proportion
Campylobacter 1995 Age Missing 0.09384
Campylobacter 1995 Age Unknown 0.00000
Campylobacter 1995 City Missing 0.40548
Campylobacter 1995 City Unknown 0.00000
Campylobacter 1995 County Missing 0.11610
Campylobacter 1995 County Unknown 0.00000
Campylobacter 1995 Gender Missing 0.00000
Campylobacter 1995 Gender Unknown 0.05479
Campylobacter 1995 Serotype Missing 0.00000
Campylobacter 1995 Serotype Unknown 0.10582
请注意,数据框包含PATHOGEN
的4个不同因素和Year
的宽数值范围,并且我为Group
的每个值对Variable
的行进行分组(即人口统计变量)。
我已经能够使用ggplot2
包使用以下代码完成我的目标:
plot<-ggplot(df, aes(x=Year, y=Proportion, group=Group, colour=Group)) + geom_line()
plot1<-plot + facet_grid(PATHOGEN ~ Variable, scales="free", space="free")`
然而,这并没有给出每个图的独立比例,而是每行的独立比例。我认为这是因为使用facet_grid
时这个功能不可用,而我更喜欢每个面板都有自己的y轴和x轴(即一些病原体在早期的范围内没有数据) ,因此被挤压在他们的面板的最右侧)。
我是否以错误的方式思考这个问题?有没有办法在没有重要数据操作的情况下执行此操作?感谢。