我有一个非常大的数据框,想要创建一些简单的表。数据集如此之大的问题在于我有很多只出现几次的值。
我想要实现的是为每个定性变量创建一个表,并且每个变量中出现的值最少出现在分组标记下。第一部分很简单:
sapply(dat[!sapply(dat, is.numeric)], table)
但是如何对存在的值小于x次的值进行分组,并将它们放在“其他”标签中的表中?是否有任何具有参数的表函数可以执行此操作?或者我是否必须手动操作data.frame
,查找所有可能出现的值并将其值更改为“其他”?