我正在使用数据框,其中一列是一个多值变量,我已将其作为列实现为列。 这是一个可重复的例子:
df <- data.frame(title=c('one','two','three'), subjects=I(list(c('A'), c('A','B','C','D'), c('B','D','E'))))
一般的想法是,我可以在不占用太多空间的情况下附加尽可能多的主题。 现在可能的主题集并不那么大,所以如果它是一个简单的专栏,我会把它变成一个因素。但是,如果我在这里这样做,R会为每个列表项(即每行)单独存储levels属性,再次需要大量存储空间。
是否有人知道存储因子列表的方法,将这些因素的级别作为共享属性?
我唯一能想到的就是自己做,将值存储为整数并创建一个单独的查找表,但这看起来效率不高。