如果标签连接到该标识符,我准备了一个包含大约20k行唯一标识符的数据集和包含布尔信息的~60列:
ID Gender Tag1 Tag2 Tag3 Tag4 Tag5 Tag6 Tag 7 ...
A m 0 1 1 0 0 0 0 ...
B m 1 0 1 0 0 1 0 ...
C f 1 1 0 0 0 1 1 ...
我想在Gephi中探索数据,但不知道要使用哪种导出结构/格式。为了能够探索标签之间的关系,数据应该如何?到达这个结构我需要做什么?我是否需要进一步总结它,我可以将性别数据作为分析属性保存在那里吗?
答案 0 :(得分:1)
假设您的数据代表一个网络,这里有一种方法可以将其导出为边缘列表csv:
df <- read.table(header =T, sep =";", text = "ID;Gender;Tag1;Tag2;Tag3;Tag4;Tag5;Tag6;Tag7
A;m;0;1;1;0;0;0;0
B;m;1;0;1;0;0;1;0
C;f;1;1;0;0;0;1;1")
library(dplyr)
library(tidyr)
library(magrittr)
df %>%
gather(Target, isTrue, -ID, -Gender) %>%
filter(isTrue == 1) %>%
select(-isTrue) %>%
set_names(c("Source", "Gender", "Target")) %>%
write.csv(file = file.path(tempdir(), "my.csv"), row.names = FALSE)
您可以在Gephi中将其作为边缘列表导入,让gephi自动创建节点列表: