我有一组长度为4的5000个字符串,其中字符串中的每个字符可以是A,B,C或D.
0阶马尔可夫链(无依赖性),制作A,B,C,D列的4 * 1数组。
1阶马尔可夫链(pos j取决于先前的pos i),得到行Ai,Bi,Ci,Di的4×4矩阵;以及Aj,Bj,Cj,Dj的列。
2阶马尔可夫链(pos k取决于pos j和pos i),得到尺寸为Ai,Bi,Ci,Di的4 * 4 * 4矩阵; Aj,Bj,Cj,Dj;和Ak,Bk,Ck,Dk [或者这是一个16 * 4矩阵的维数Aij,Bij,Cij,Dij; Ak,Bk,Ck,Dk]。
三阶马尔可夫链(pos l取决于pos k,pos j和pos i),得到尺寸为Ai,Bi,Ci,Di的4 * 4 * 4 * 4矩阵; Aj,Bj,Cj,Dj; Ak,Bk,Ck,Dk; Al,Bl,Cl,Dl [或者这使得尺寸为Aijk,Bijk,Cijk,Dijk的64 * 4矩阵; Al,Bl,Cl,Dl]。
4个订单的参数数量是多少?我有一些想法,但想看看别人的想法。谢谢你的任何建议!!
答案 0 :(得分:0)
正如评论中所指出的,答案几乎包含在问题中。对于n> 1,完全指定具有n个可能状态的第k阶马尔可夫模型的独立参数的数量的通式为n ^ k *(n-1)。
该通式的推导与详细描述相同 How does Morkov Chain works and what is memorylessness? 因为n = 3且k = 2。
具体地,如果我们考虑k个先前步骤(包括当前步骤)来预测下一步骤,则转移矩阵应该允许所有可能的排列,因此其维度是n ^ k乘以n ^ k。但是,因为对于每个状态,只有n个结果是可能的,所以该矩阵的每一行只有n个非零项。因此,我们有这个转移矩阵的n * n ^ k个非零项,并且每列应该总和为1.因此,为了获得独立参数数量的答案,我们需要从非数量中减去n ^ k -zero条目。
此答案不包括初始条件,如果您正在寻找稳态解决方案,则不需要这些条件。如果您对瞬态解决方案感兴趣,则需要指定其他(n-1)* k个参数。