将数据帧转换为邻接矩阵/边缘列表以进行网络分析

时间:2016-10-19 04:15:48

标签: r networking matrix adjacency-matrix network-analysis

我正在尝试将数据框从在线论坛转换为社交网络,但我不知道如何将数据转换为网络分析所需的邻接矩阵/边缘列表。

我的代码如下:

library(igraph)  
graph.data.2002 <- as.matrix(data.2002[,2:3])  
g.2002 <- graph.data.frame(graph.data.2002, directed=FALSE)  
plot(g.2002, vertex.size = 1, vertex.label=NA)  

我使用R进行分析。当前的问题是作者通过ThreadID相互链接,但是在进行网络分析时,它将ThreadID作为节点包含在内。理想情况下,我喜欢邻接矩阵/边缘列表,如果作者在同一个线程上与所有作者交互,则显示1。

(第一次发帖,请告诉我是否有任何遗漏/不合适的事情)

目前数据如下:

ThreadID    AuthorID
659289  193537
432269  136196
572531  170305
230003  32359
459059  47875
635953  181593
235116  51993

1 个答案:

答案 0 :(得分:4)

您可以使用inner_join获取类似边缘列表的内容(只需要轻微的重新格式化)。

如果我理解正确,test 1应该只有一个连接,位于作者193537和32359之间的线程659289.

test1 <- data.frame(ThreadID = c(659289, 432269, 572531, 659289),
                 AuthorID = c(193537, 136196, 170305, 32359))
test2 <- dplyr::inner_join(test1, test1, by = "ThreadID")[,-1]
test3 <- apply(test2, 2, as.character) #AuthorID as character will become vertex ID

检查您是否得到了预期:

library(network)
test.network <- network(test3, directed = FALSE)
as.sociomatrix(test.network)
as.edgelist(test.network)
plot(test.network, label = test.network%v%"vertex.names")