我有一个来自Qualtrics调查的松鼠数据集。它看起来像这样:
V3 Q8_42 Q8_33 Q8_72 Q8_38 Q13_1_42 Q13_1_33 Q13_1_72 Q13_1_38
Chap A . 1 . . . 4 . .
Chap B 1 . . . 4 . . .
Chap C . . . . . . . .
Chap D . . . . . . . .
快照显示四个人询问他们是否是朋友(q8_42是A; q8_33是B,q8_72是C,q8_38是D)。如果有人说他们是朋友,那么他们被问及他们的友谊的强度是1-5级(q13_1_42代表A,q13_1_33代表B代表,q13_1_72代表C代表,q13_1_38代表D代表)。总而言之,我有95个人,并且在向他们提出的所有9个问题中都有:他们的友谊。我应该如何运行矩阵运算,以便最终得到以下矩阵,每个友谊问题1:
Chap A Chap B Chap C Chap D
Chap A 0 4 . .
Chap B 4 0 . .
Chap C . . 0 .
Chap D . . . 0
我的解决方案是将数据(名为“kolp”)读入R,然后运行
Chap.A <- (kolp$q8_42 * kolp$q13_1_42)
Chap.B <- (kolp$q8_33 * kolp$q13_1_33)
Chap.C <- (kolp$q8_72 * kolp$q13_1_72)
Chap.D <- (kolp$q8_38 * kolp$q13_1_38)
Mat.1 <- cbind(Chap.A, Chap.B, Chap.C, Chap.D)
rownames(Mat.1) <- c("Chap.A", "Chap.B", "Chap.C", "Chap.D")
这给了我
Chap.A Chap.B Chap.C Chap.D
Chap.A NA 4 NA NA
Chap.B 4 NA NA NA
Chap.C NA NA NA NA
Chap.D NA NA NA NA
但我知道这是一个笨重的方法,特别是9个矩阵提取为* .csv或* .txt文件,昏暗的95x95
答案 0 :(得分:0)
假设列的格式为“questionID_individualID”,您可以尝试使用此功能处理数据:
f <- function(dat)
{
n <- names(dat)
id <- substring(n, nchar(n)-1)
qu_id <- substring(n, 1, nchar(n)-3)
individuals <- sort(unique(id))
questions <- unique(qu_id)
result <- 1
for(q in questions)
{
filter <- qu_id==q
result <- result * dat[,filter][,match(individuals, id[filter])]
}
result
colnames(result) <- individuals
result
}
用作f(kolp)
。即使列无序也可以工作。但如果某些问题没有所有人的专栏,那么它将失败(或给出错误的结果)。