R:不同列表项之间的股票因子水平?

时间:2017-12-04 13:22:47

标签: r

我正在使用数据框,其中一列是一个多值变量,我已将其作为列实现为列。 这是一个可重复的例子:

df <- data.frame(title=c('one','two','three'), subjects=I(list(c('A'), c('A','B','C','D'), c('B','D','E'))))

一般的想法是,我可以在不占用太多空间的情况下附加尽可能多的主题。 现在可能的主题集并不那么大,所以如果它是一个简单的专栏,我会把它变成一个因素。但是,如果我在这里这样做,R会为每个列表项(即每行)单独存储levels属性,再次需要大量存储空间。

是否有人知道存储因子列表的方法,将这些因素的级别作为共享属性?

我唯一能想到的就是自己做,将值存储为整数并创建一个单独的查找表,但这看起来效率不高。

0 个答案:

没有答案