我有一个带有Vector-Objects的List,它基本上是这样的:
print(myDocuments)
[[1]]
[1] 4234 3134 1224
[[2]]
[1] 1234 1312 4123
[[3]]
[1] 1266 4234
[[4]]
[1] 1266 4234 4123 1234
因此myDocuments
为每个文档保存一个Vector(总共4个文档),每个Vector包含一组哈希码(在本例中由4位int简化)。
我现在需要的是data.frame
或matrix
,其中列是文档,行是文档的哈希码。如果特定文档中存在哈希,则数据框应显示1,否则显示0,如下所示:
N D1 D2 D3 D4
1224 1 1 0 1
1234 0 1 0 1
1266 0 0 1 1
3134 1 0 0 0
4234 1 0 1 1
4123 0 1 0 1
我真的很难在R中完成这项任务,感谢任何帮助!
提前致谢!
答案 0 :(得分:0)
我们可以尝试
library(qdapTools)
t(mtabulate(myDocuments))
# [,1] [,2] [,3] [,4]
#1224 1 0 0 0
#1234 0 1 0 1
#1266 0 0 1 1
#1312 0 1 0 0
#3134 1 0 0 0
#4123 0 1 0 1
#4234 1 0 1 1