我正在寻找创建一个数据帧,该数据帧实质上是随机向量的组合。这个想法是,每个向量代表用户路径的某些元素(用字母表示),而数据帧是所有这些路径的集合。
我已经按照以下方式创建了数据框(可能是一种更有效的方法)
df1 <- data.frame(replicate(25, sample(LETTERS[1:10])))
paths <- data.frame(t(df1[-1]))
colnames(paths) <- rownames(df1)
> head(paths)
1 2 3 4 5 6 7 8 9 10
X2 A B D F E J I H C G
X3 F E A I H G D C J B
X4 H I A J B G E F C D
X5 B J E I A D C G F H
X6 F D C J A G B E I H
X7 H I J B D A C E F G
但是我想添加一些概率条件。例如,在任何给定的字母行序列中,“ A”应该在“ C”之前的任何时候出现的可能性为70%,“ B”和“ D”应该在“ F”之前的任何时候出现的可能性是40%,“ D”应该总是 紧接在“ G”之前-这样的事情。用户无法循环回到给定的序列(尽管我也很想知道如何表示该序列-一个单独的问题)
我知道在生成数字的随机序列时可以添加概率约束,但是这里我需要为分类变量指定一个具有概率约束的序数结构。必须承认,我什至不知道从哪里开始。
任何提示或指针将不胜感激!