我有一个用户级别的调查数据库,其中一个字段具有用户已选择的多个选择。例子
col1 | col2
ID1 | a, b, c
ID2 | c, f
ID3 | g, k, z
我想使用R重塑文件,如下所示:
col1| col2(a)| col3(b)| col4(c)| col5(f)| col6(g)| col7(k)| col8(z)**
ID1 | 1 | 1 | 1 | 0 | 0 | 0 | 0
ID2 | 0 | 0 | 1 | 1 | 0 | 0 | 0
ID3 | 0 | 0 | 0 | 0 | 1 | 1 | 1
请注意:我不知道原始的多项选择字段中存在多少个不同的值。
谢谢
答案 0 :(得分:0)
一个选项是mtabuate
除以'col2'后的,
library(qdapTools)
cbind(df1[1], mtabulate(strsplit(df1$col2, ", ")))