R:用于Gephi的结构标签数据

时间:2015-02-13 22:21:46

标签: r gephi network-analysis

如果标签连接到该标识符,我准备了一个包含大约20k行唯一标识符的数据集和包含布尔信息的~60列:

ID   Gender   Tag1   Tag2   Tag3   Tag4   Tag5   Tag6   Tag 7   ...
A    m        0      1      1      0      0      0      0       ...
B    m        1      0      1      0      0      1      0       ...
C    f        1      1      0      0      0      1      1       ...

我想在Gephi中探索数据,但不知道要使用哪种导出结构/格式。为了能够探索标签之间的关系,数据应该如何?到达这个结构我需要做什么?我是否需要进一步总结它,我可以将性别数据作为分析属性保存在那里吗?

1 个答案:

答案 0 :(得分:1)

假设您的数据代表一个网络,这里有一种方法可以将其导出为边缘列表csv:

df <- read.table(header =T, sep =";", text = "ID;Gender;Tag1;Tag2;Tag3;Tag4;Tag5;Tag6;Tag7
A;m;0;1;1;0;0;0;0
B;m;1;0;1;0;0;1;0
C;f;1;1;0;0;0;1;1")

library(dplyr)
library(tidyr)
library(magrittr)
df %>%
  gather(Target, isTrue, -ID, -Gender) %>%
  filter(isTrue == 1) %>%
  select(-isTrue) %>%
  set_names(c("Source", "Gender", "Target")) %>%
  write.csv(file = file.path(tempdir(), "my.csv"), row.names = FALSE)

您可以在Gephi中将其作为边缘列表导入,让gephi自动创建节点列表:

enter image description here