我是新手,非常感谢你提前咨询
我想制作共生矩阵,并按照下面的链接
How to use R to create a word co-occurrence matrix
但我无法理解为什么A-A的值在下面的matirx中是10 应该是4不是吗?因为有四个A
dat< - read.table(text ='film tag1 tag2 tag3
1 A A A
2 A C F
3 B D C',header = T)
crossprod(as.matrix(mtabulate(as.data.frame(t(dat [, - 1]))))))
()A C F B D
A 10 1 1 0 0
C 1 2 1 1 1
F 1 1 1 0 0
B 0 1 0 1 1
D 0 1 0 1 1
答案 0 :(得分:0)
你使用的解决方案假设每个标签每个标签只出现一次,据我所知,它与共生矩阵的定义相吻合。因此,第一行中的每个A
都会被计为与其自身和其他两个A
共同出现,因此在A
中计算时会导致共有十个同时出现在第二行。