data.frame中具有特定列的矩阵运算

时间:2013-03-27 18:59:45

标签: r qualtrics

我有一个来自Qualtrics调查的松鼠数据集。它看起来像这样:

V3       Q8_42  Q8_33  Q8_72   Q8_38  Q13_1_42 Q13_1_33 Q13_1_72 Q13_1_38
Chap A     .    1       .        .       .      4        .        .
Chap B     1    .       .        .       4      .        .        .
Chap C     .    .       .        .       .      .        .        .
Chap D     .    .       .        .       .      .        .        .

快照显示四个人询问他们是否是朋友(q8_42是A; q8_33是B,q8_72是C,q8_38是D)。如果有人说他们是朋友,那么他们被问及他们的友谊的强度是1-5级(q13_1_42代表A,q13_1_33代表B代表,q13_1_72代表C代表,q13_1_38代表D代表)。总而言之,我有95个人,并且在向他们提出的所有9个问题中都有:他们的友谊。我应该如何运行矩阵运算,以便最终得到以下矩阵,每个友谊问题1:

       Chap A   Chap B  Chap C  Chap D
Chap A  0       4       .       .
Chap B  4       0       .       .
Chap C  .       .       0       .
Chap D  .       .       .       0

我的解决方案是将数据(名为“kolp”)读入R,然后运行

Chap.A <- (kolp$q8_42 * kolp$q13_1_42)
Chap.B <- (kolp$q8_33 * kolp$q13_1_33)
Chap.C <- (kolp$q8_72 * kolp$q13_1_72)
Chap.D <- (kolp$q8_38 * kolp$q13_1_38)
Mat.1 <- cbind(Chap.A, Chap.B, Chap.C, Chap.D)
rownames(Mat.1) <- c("Chap.A", "Chap.B", "Chap.C", "Chap.D")

这给了我

         Chap.A Chap.B Chap.C Chap.D
Chap.A     NA      4     NA     NA
Chap.B      4     NA     NA     NA
Chap.C     NA     NA     NA     NA
Chap.D     NA     NA     NA     NA

但我知道这是一个笨重的方法,特别是9个矩阵提取为* .csv或* .txt文件,昏暗的95x95

1 个答案:

答案 0 :(得分:0)

假设列的格式为“questionID_individualID”,您可以尝试使用此功能处理数据:

f <- function(dat)
{
    n <- names(dat)

    id <- substring(n, nchar(n)-1)

    qu_id <- substring(n, 1, nchar(n)-3)

    individuals <- sort(unique(id))

    questions <- unique(qu_id)

    result <- 1

    for(q in questions)
    {
        filter <- qu_id==q

        result <- result * dat[,filter][,match(individuals, id[filter])]
    }

    result

    colnames(result) <- individuals

    result
}

用作f(kolp)。即使列无序也可以工作。但如果某些问题没有所有人的专栏,那么它将失败(或给出错误的结果)。