我需要有关如何使用gtsummary包编写R代码以创建具有多个分类变量作为行的汇总表的信息,而列端(“ by”变量)在我的情况下是一个数字变量,以年为单位。因此,从本质上讲,我想根据平均年龄/中位年龄来总结几个患者的分类特征。
例如,在此包中,使用数据“试验”,例如,我希望在表的行轴上具有分类变量(标记,阶段,等级),而按变量是“年龄” ,因此这些变量的每个类别的年龄中位数都是如此。
感谢您的帮助。 妮莉
答案 0 :(得分:1)
我不清楚您要问什么。我猜您想按高龄和低龄来汇总数据(在下面的示例中以中位数分割)?
首先,您将要创建一个分类年龄变量。
library(gtsummary)
library(tidyverse)
df_age_example <-
trial %>%
mutate(
# create a categorical age variable split at the median
age2 = ifelse(
age >= median(.$age, na.rm = TRUE),
"Age Above or at Median",
"Age Below Median"
)
) %>%
# keep variables to be summarized
select(age2, marker, grade)
然后,您需要将该数据帧传递到tbl_summary()
以汇总数据。
tbl_summary(data= df_age_example, by = age2)
这将产生下表。
我希望这会有所帮助。祝您编码愉快!