Question

我有一个用户级别的调查数据库，其中一个字段具有用户已选择的多个选择。例子

col1 | col2 ID1 | a, b, c ID2 | c, f ID3 | g, k, z

我想使用R重塑文件，如下所示：

col1| col2(a)| col3(b)| col4(c)| col5(f)| col6(g)| col7(k)| col8(z)** ID1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 ID2 | 0 | 0 | 1 | 1 | 0 | 0 | 0 ID3 | 0 | 0 | 0 | 0 | 1 | 1 | 1

请注意：我不知道原始的多项选择字段中存在多少个不同的值。

谢谢

Answer 1

一个选项是mtabuate除以'col2'后的,

library(qdapTools)
cbind(df1[1], mtabulate(strsplit(df1$col2, ", ")))

将调查文本单元格拆分为多个（唯一和二进制）列

1 个答案: