如何将概率插入矩阵?

时间:2016-05-03 22:46:13

标签: r algorithm vector probability bayesian

什么是可以自动化并填写矩阵A的好程序?

我们有col矢量:

col=c(1,1,2,3,4,5,10,7,7,3,1,5,3,7,6,3,4,2,1,1,2,2,6,4,8,8,9,1,3,2)
col
[1]  1  1  2  3  4  5 10  7  7  3  1  5  3  7  6  3  4  2  1  1  2  2  6  4  8
[26]  8  9  1  3  2

我们有矩阵:

A=rbind(c(0:10),c(1,rep(0,10)),c(2,rep(0,10)),c(3,rep(0,10)),c(4,rep(0,10)),c(5,rep(0,10)),c(6,rep(0,10)),c(7,rep(0,10)),c(8,rep(0,10)),c(9,rep(0,10)),c(10,rep(0,10)))
A
      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11]
 [1,]    0    1    2    3    4    5    6    7    8     9    10
 [2,]    1    0    0    0    0    0    0    0    0     0     0
 [3,]    2    0    0    0    0    0    0    0    0     0     0
 [4,]    3    0    0    0    0    0    0    0    0     0     0
 [5,]    4    0    0    0    0    0    0    0    0     0     0
 [6,]    5    0    0    0    0    0    0    0    0     0     0
 [7,]    6    0    0    0    0    0    0    0    0     0     0
 [8,]    7    0    0    0    0    0    0    0    0     0     0
 [9,]    8    0    0    0    0    0    0    0    0     0     0
[10,]    9    0    0    0    0    0    0    0    0     0     0
[11,]   10    0    0    0    0    0    0    0    0     0     0

矩阵A的第一列表示col矢量中的前面的值

矩阵A的第一行表示col矢量中的以下值 在矩阵A中,我们想要替换0'并存储条件概率。

通过查看col矢量,我查看所有涉及1作为前一个数字的实例,例如1,1,2,1,5,1,1,3 1,3。

我想出了以下条件概率:

鉴于col矢量中前面的数字为1,后面的数字为1的概率等于:2/6。

鉴于前面的数字为1,以下数字为2的概率等于:2/6。

鉴于前面的数字为1,后面的数字为3的概率等于:1/6。

鉴于前面的数字为1,以下数字为5的概率等于:1/5。

我们使用这些值填充Matrix A的第一行。我们获得了A的新版本。

A=rbind(c(0:10),c(1,2/6,2/6,1/6,0,1/6,0,0,0,0,0),c(2,rep(0,10)),c(3,rep(0,10)),c(4,rep(0,10)),c(5,rep(0,10)),c(6,rep(0,10)),c(7,rep(0,10)),c(8,rep(0,10)),c(9,rep(0,10)),c(10,rep(0,10)))
> A
      [,1]      [,2]      [,3]      [,4] [,5]      [,6] [,7] [,8] [,9] [,10] [,11]
 [1,]    0 1.0000000 2.0000000 3.0000000    4 5.0000000    6    7    8     9    10
 [2,]    1 0.3333333 0.3333333 0.1666667    0 0.1666667    0    0    0     0     0
 [3,]    2 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
 [4,]    3 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
 [5,]    4 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
 [6,]    5 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
 [7,]    6 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
 [8,]    7 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
 [9,]    8 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
[10,]    9 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0
[11,]   10 0.0000000 0.0000000 0.0000000    0 0.0000000    0    0    0     0     0

我们要填写第2行,第3行一直到10。

我是手动完成的,但是什么是一个可以自动化并填写矩阵A的好程序?

2 个答案:

答案 0 :(得分:1)

使用aggregatedcast不确定这是否是最有效的方法:

# Get data.
col=c(1,1,2,3,4,5,10,7,7,3,1,5,3,7,6,3,4,2,1,1,2,2,6,4,8,8,9,1,3,2)

# Make shifted vector and make a data frame.
index <- 1:length(col) - 1
index <- tail(index, length(col) - 1)
col.shift <-  c(col[index + 1], NA)
df <- data.frame(list("value" = col, "next.value" = col.shift))

# Count number of values per combination.
df$count <- 1
# Count number of value appearences..
df.agg.row <- aggregate(count ~ value, df, FUN = sum)

# Pivot the data.
library(reshape2)
res <- dcast(df, value ~ next.value, fun.aggregate = length)

# Get probability of number (row) being followed by number (col).
res2 <- res[, 2:11] / df.agg.row$count 

答案 1 :(得分:0)

谢谢大家的意见。我能够找到自己问题的答案。 如果有人有兴趣,那么你可以查看我的解决方案。

A=rbind(c(0:10),c(1,rep(0,10)),c(2,rep(0,10)),c(3,rep(0,10)),c(4,rep(0,10)),c(5,rep(0,10)),c(6,rep(0,10)),c(7,rep(0,10)),c(8,rep(0,10)),c(9,rep(0,10)),c(10,rep(0,10)))
    col=c(1,1,2,3,4,5,10,7,7,3,1,5,3,7,6,3,4,2,1,1,2,2,6,4,8,8,9,1,3,2)
    j=length(col)
    A
    while (j>1){
    if (col[j]==col[j-1]){A[match(col[j],A[,1]),match(col[j-1],A[1,])]=A[match(col[j],A[,1]),match(col[j-1],A[1,])]+1}else{
    if (col[j]!=col[j-1]){A[match(col[j],A[,1]),match(col[j-1],A[1,])]=A[match(col[j],A[,1]),match(col[j-1],A[1,])]+1} }
    j=j-1
    }
    A
    A=t(A)
    A=A[-1,-1]
    for (i in 1:nrow(A)){
    A[i,]=A[i,]/sum(A[1,])
    }
    A