通过数字汇总类别变量:gtsummary程序包

时间:2020-04-20 20:23:37

标签: r gtsummary

我需要有关如何使用gtsummary包编写R代码以创建具有多个分类变量作为行的汇总表的信息,而列端(“ by”变量)在我的情况下是一个数字变量,以年为单位。因此,从本质上讲,我想根据平均年龄/中位年龄来总结几个患者的分类特征。

例如,在此包中,使用数据“试验”,例如,我希望在表的行轴上具有分类变量(标记,阶段,等级),而按变量是“年龄” ,因此这些变量的每个类别的年龄中位数都是如此。

感谢您的帮助。 妮莉

1 个答案:

答案 0 :(得分:1)

我不清楚您要问什么。我猜您想按高龄和低龄来汇总数据(在下面的示例中以中位数分割)?

首先,您将要创建一个分类年龄变量。

library(gtsummary)
library(tidyverse)

df_age_example <-
  trial %>%
  mutate(
    # create a categorical age variable split at the median
    age2 = ifelse(
      age >= median(.$age, na.rm = TRUE),
      "Age Above or at Median",
      "Age Below Median"
    )
  ) %>%
  # keep variables to be summarized 
  select(age2, marker, grade)

然后,您需要将该数据帧传递到tbl_summary()以汇总数据。

tbl_summary(data= df_age_example, by = age2)

这将产生下表。

enter image description here

我希望这会有所帮助。祝您编码愉快!