共生矩阵

时间:2017-11-01 12:19:23

标签: matrix cross-product

我是新手,非常感谢你提前咨询

我想制作共生矩阵,并按照下面的链接

How to use R to create a word co-occurrence matrix

但我无法理解为什么A-A的值在下面的matirx中是10 应该是4不是吗?因为有四个A

  

dat< - read.table(text ='film tag1 tag2 tag3

  • 1 A A A

  • 2 A C F

  • 3 B D C',header = T)

  

crossprod(as.matrix(mtabulate(as.data.frame(t(dat [, - 1]))))))

()A C F B D

A 10 1 1 0 0

C 1 2 1 1 1

F 1 1 1 0 0

B 0 1 0 1 1

D 0 1 0 1 1

1 个答案:

答案 0 :(得分:0)

你使用的解决方案假设每个标签每个标签只出现一次,据我所知,它与共生矩阵的定义相吻合。因此,第一行中的每个A都会被计为与其自身和其他两个A共同出现,因此在A中计算时会导致共有十个同时出现在第二行。