尊敬的stackoverflow社区, 我有两个问题,但是我认为它们是相关的。
我在解释seqefsub()
函数的输出时遇到问题,该函数是用于序列分析的TraMineR
库的一部分。
我的目标是找到最频繁的过渡。为此,我想使用seqefsub()
函数。
但是结果令人困惑
我得到令人困惑的结果,因为在我看来某些子序列是相同的,例如 (H)-(A> G),(H)-(H> A)-(A> G)和(H> A)-(A> G)。这些子序列在哪里不同?
使用事件序列的transition
或state
“表示”,我得到了不同的结果。我希望他们会以不同的方式代表正义。有什么不同的做法?
我希望我只是不理解“子序列”的含义?
感谢您的回答!非常感谢!
数据
seq_data <- structure(list(SEQ_1 = c("H", "H", "H", "H", "H", "H", "H", "H",
"H", "B", "H", "H", "H", "H", "H", "H", "A", "A", "A", "H", "H",
"H", "A", "H", "H", "G", "A", "C", "H", "H", "E", "H", "H", "H",
"H", "H", "A", "H", "H", "B", "D", "H", "H", "H", "G", "G", "H",
"H", "G", "H", "H", "D", "H", "G", "H", "H", "G", "H", "H", "H",
"H", "H", "C", "H", "G", "H", "H", "H", "H", "H", "H", "H", "H",
"H", "H", "A", "H", "H", "H", "G", "H", "H", "H", "H", "H", "G",
"H", "H", "H", "H", "H", "G", "H", "A", "H", "H", "H", "H", "H",
"H", "H", "H", "A", "G", "H", "H", "H", "H", "A", "H", "H", "A",
"H", "H", "H", "B", "H", "H", "H", "H", "H", "H", "H", "A", "G",
"H", "A", "F", "A", "H", "H", "G", "B", "H", "A", "G", "H", "A",
"H", "H", "H", "G", "A", "H", "H", "H", "H", "H", "A", "H", "A",
"H", "H", "H", "G", "D", "G", "H", "H", "A", "H", "C", "H", "H",
"A", "H", "A", "H", "G", "H", "H", "H", "H", "G", "G", "H", "H",
"H", "H", "G", "H", "H", "H", "A", "H", "A", "H", "H", "H", "F",
"H", "H", "H", "H", "D", "G", "H", "H", "G", "H", "H", "H", "G",
"H", "H", "H", "H", "F", "H", "E", "H", "H", "H", "H", "H", "H",
"G", "H", "H", "H", "H", "H", "H", "G", "C", "H", "H", "H", "G",
"H", "H", "H", "H", "H", "H", "H", "H", "H", "A", "G", "A", "H",
"H", "H", "A", "A", "H", "H", "H", "H", "H", "C", "H", "H", "H",
"H", "H", "A", "H", "C", "B", "H"),
SEQ_2 = c("A", "A", "H", "H", "G", "B", "B", "C", "A", "A", "B", "A", "F",
"A", "B", "E", "G", "A", "A", "H", "D", "G", "G", "G", "F", "A",
"G", "G", "H", "H", "E", "H", "H", "C", "G", "A", "G", "A", "B",
"C", "E", "C", "A", "A", "B", "A", "B", "H", "B", "G", "A", "D",
"A", "A", "H", "A", "G", "B", "B", "H", "A", "A", "C", "A", "G",
"C", "G", "A", "H", "A", "E", "G", "A", "A", "A", "A", "H", "G",
"E", "A", "G", "A", "B", "A", "B", "G", "A", "A", "D", "B", "A",
"B", "G", "A", "B", "A", "A", "A", "H", "C", "A", "A", "G", "A",
"H", "A", "A", "B", "A", "A", "A", "G", "A", "C", "G", "A", "H",
"A", "G", "H", "B", "A", "A", "A", "A", "G", "G", "F", "G", "H",
"G", "G", "B", "B", "G", "A", "A", "F", "H", "H", "H", "G", "A",
"A", "F", "A", "A", "A", "B", "A", "A", "G", "A", "A", "A", "F",
"D", "A", "A", "G", "A", "B", "B", "A", "F", "C", "C", "A", "B",
"A", "C", "A", "A", "A", "A", "H", "G", "H", "H", "E", "B", "G",
"G", "B", "B", "A", "C", "A", "A", "F", "C", "C", "G", "C", "G",
"D", "A", "G", "A", "A", "C", "A", "A", "C", "C", "A", "E", "B",
"H", "G", "A", "C", "B", "A", "A", "G", "B", "H", "B", "B", "C",
"H", "B", "C", "F", "A", "H", "H", "A", "C", "B", "E", "B", "G",
"B", "C", "G", "H", "A", "G", "A", "C", "A", "A", "A", "B", "B",
"H", "A", "A", "A", "C", "B", "A", "B", "C", "A", "B", "F", "B",
"G", "H"),
SEQ_3 = c("G", "C", "H", "A", "A", "G", "B", "G", "G", "B",
"G", "G", "G", "G", "B", "D", "G", "A", "A", "A", "G", "G",
"G", "G", "G", "A", "C", "G", "B", "A", "D", "A", "B", "G",
"B", "G", "G", "A", "A", "B", "B", "A", "G", "G", "B", "C",
"G", "B", "G", "C", "B", "G", "A", "G", "B", "A", "A", "B",
"G", "A", "G", "G", "G", "G", "G", "G", "A", "A", "B", "G",
"A", "G", "B", "G", "A", "A", "A", "G", "G", "F", "G", "G",
"G", "A", "B", "G", "G", "G", "G", "G", "A", "B", "C", "G",
"G", "G", "A", "G", "H", "B", "G", "G", "G", "G", "H", "A",
"B", "B", "G", "B", "G", "G", "A", "G", "G", "A", "A", "G",
"B", "B", "G", "B", "A", "A", "A", "A", "G", "E", "G", "B",
"B", "G", "B", "B", "G", "A", "G", "F", "A", "A", "C", "G",
"A", "D", "G", "G", "G", "G", "A", "G", "A", "E", "F", "G",
"A", "F", "E", "A", "A", "G", "G", "B", "G", "A", "F", "G",
"C", "A", "B", "C", "A", "G", "G", "G", "B", "A", "G", "B",
"C", "G", "A", "B", "A", "C", "B", "A", "C", "C", "G", "A",
"A", "G", "G", "F", "G", "G", "A", "G", "A", "B", "B", "A",
"G", "B", "G", "G", "G", "G", "A", "G", "A", "C", "B", "G",
"A", "G", "A", "A", "B", "A", "G", "E", "G", "G", "D", "G",
"A", "B", "G", "A", "B", "E", "G", "G", "G", "B", "A", "H",
"G", "A", "A", "C", "A", "G", "A", "B", "C", "B", "G", "G",
"A", "C", "G", "G", "G", "G", "G", "B", "A", "A", "G", "H"),
SEQ_4 = c("I", "I", "D", "I", "A", "G", "B", "G", "G",
"I", "I", "I", "I", "I", "I", "G", "I", "I", "I", "A", "I",
"I", "G", "G", "G", "G", "I", "I", "I", "I", "G", "G", "B",
"G", "G", "I", "I", "I", "G", "I", "I", "A", "G", "G", "B",
"A", "G", "G", "G", "G", "I", "G", "D", "G", "G", "B", "I",
"A", "I", "G", "G", "G", "G", "I", "I", "G", "I", "G", "D",
"I", "I", "G", "A", "I", "I", "A", "G", "I", "G", "I", "B",
"I", "I", "A", "A", "I", "I", "G", "I", "G", "I", "A", "G",
"I", "G", "G", "G", "G", "F", "I", "G", "I", "I", "I", "G",
"G", "I", "I", "I", "A", "I", "I", "I", "I", "I", "I", "G",
"I", "G", "B", "I", "A", "G", "I", "I", "G", "G", "G", "I",
"G", "G", "G", "I", "I", "G", "G", "I", "G", "G", "A", "I",
"I", "G", "G", "G", "G", "I", "I", "I", "I", "A", "D", "D",
"B", "I", "G", "D", "I", "I", "G", "G", "G", "G", "A", "E",
"I", "I", "A", "B", "C", "I", "I", "I", "G", "I", "G", "I",
"B", "C", "G", "G", "E", "I", "I", "I", "I", "I", "I", "G",
"I", "I", "I", "G", "G", "I", "I", "A", "G", "I", "B", "I",
"A", "I", "C", "G", "I", "G", "I", "G", "I", "A", "G", "I",
"G", "A", "G", "G", "I", "B", "I", "G", "E", "G", "I", "G",
"G", "G", "G", "I", "G", "B", "G", "I", "G", "G", "G", "I",
"B", "I", "G", "I", "G", "I", "G", "I", "B", "F", "I", "I",
"G", "G", "I", "G", "G", "G", "G", "G", "B", "G", "I", "G",
"A"),
weights = c(1.193572, 1.193572, 1.09698, 0.538388,
0.532709, 0.503224, 0.547916, 1.113717, 0.838522, 4.31029,
0.636802, 0.583736, 0.812172, 1.336007, 0.645919, 0.840518,
0.873673, 0.914939, 0.785616, 0.931976, 0.883077, 0.960107,
0.917529, 0.629383, 4.602061, 1.224961, 0.819434, 0.640803,
1.177564, 0.866287, 1.562558, 3.445406, 0.965799, 0.912612,
0.85224, 0.880838, 1.124291, 0.380731, 0.611555, 0.682449,
2.372168, 0.907912, 0.667863, 0.808493, 2.612155, 1.192382,
0.802104, 0.591401, 0.989002, 2.495577, 0.626747, 5.817673,
1.06499, 1.074385, 1.098698, 0.562646, 0.804422, 0.867366,
1.281458, 1.257444, 0.9748, 1.94397, 1.658734, 0.662862,
3.009707, 0.548788, 2.353732, 1.136974, 3.29127, 1.361969,
1.660908, 0.822089, 1.268331, 0.466967, 0.567991, 0.943077,
0.542645, 2.339348, 5.817673, 2.708232, 0.924957, 1.282278,
0.755188, 0.589358, 1.02157, 0.637557, 1.095032, 1.440195,
1.958251, 0.574594, 1.612123, 0.846205, 0.89196, 0.897915,
1.705551, 0.674339, 0.629056, 0.61122, 0.64678, 0.657057,
1.712552, 1.663738, 0.460498, 1.497671, 0.632228, 2.707239,
0.657453, 1.988879, 2.052185, 0.895819, 0.395689, 0.617422,
0.767115, 0.504171, 0.537435, 2.359527, 1.044549, 0.606568,
0.939298, 0.60581, 0.726856, 0.560129, 0.663962, 0.710114,
0.884856, 0.578279, 0.671561, 1.070634, 0.568689, 1.555666,
1.452984, 0.796493, 0.631123, 0.980282, 0.721616, 1.41691,
0.533512, 0.837825, 0.694897, 0.615192, 0.845958, 0.652456,
0.759874, 0.849237, 2.137318, 1.709901, 2.961245, 0.749306,
0.887214, 0.727871, 1.377833, 1.376782, 0.56788, 0.716252,
0.724486, 1.140407, 2.863351, 0.259485, 0.376181, 0.512404,
0.558134, 0.35126, 0.482967, 0.362673, 0.286031, 0.211678,
0.210669, 0.300319, 0.189582, 0.184032, 0.195463, 0.308717,
0.398877, 0.322332, 0.241356, 0.382673, 0.47999, 0.387531,
0.265036, 0.391882, 0.207302, 0.210859, 0.632957, 0.421592,
0.2548, 0.856167, 0.991335, 0.260576, 0.288388, 0.349121,
0.457778, 0.500926, 0.161298, 0.43791, 0.58468, 1.348197,
0.360234, 0.30861, 0.268749, 0.211672, 0.336972, 0.493954,
0.472781, 0.767277, 0.47866, 0.395901, 0.249036, 0.394255,
0.201878, 0.386825, 0.537641, 1.353464, 0.303292, 0.291578,
0.290027, 0.186347, 0.414038, 0.169934, 0.295007, 0.411577,
0.370954, 0.261642, 0.357367, 0.60505, 0.378499, 0.404143,
0.405042, 0.499185, 0.249607, 0.652579, 0.206307, 0.266779,
0.310588, 0.688845, 0.549567, 0.61294, 1.252536, 1.49619,
0.790678, 0.694142, 0.506734, 2.962994, 0.64592, 0.597696,
1.225667, 0.583322, 0.530562, 0.733702, 0.586143, 0.745789,
0.629701, 0.537692, 0.735431, 0.74955, 0.792095, 1.731894,
1.334336, 0.68943, 0.227813, 0.518872, 0.406796, 0.264072)
), row.names = c(NA, 262L), class = "data.frame")
顺序和事件顺序
library(TraMineR)
stateSeq <- seqdef(seq_data,
var=c("SEQ_1", "SEQ_2", "SEQ_3", "SEQ_4"),
cnames=c("0-6", "7-10", "11-13", "14-17"),
weights = seq_data$weights)
eventSeq_transition <- seqecreate(stateSeq, tevent="transition") #transition representation
eventSeq_state <- seqecreate(stateSeq, tevent="state") #state representation
sub_transition <- seqefsub(eventSeq_transition, pmin.support = 0.05)
sub_state <- seqefsub(eventSeq_state, pmin.support = 0.05)
sub_transition[1:7]
sub_state[1:7]
输出
> sub_transition[1:7]
Subsequence Support Count
1 (H) 0.6739102 161.84128
2 (A>G) 0.2932808 70.43214
3 (H)-(H>A) 0.2866207 68.83270
4 (H>A) 0.2866207 68.83270
5 (H)-(A>G) 0.2135207 51.27754
6 (H)-(H>A)-(A>G) 0.2040370 49.00001
7 (H>A)-(A>G) 0.2040370 49.00001
Computed on 262 event sequences
Constraint Value
count.method COBJ
> sub_state[1:7]
Subsequence Support Count
1 (G) 0.7212375 173.20705
2 (H) 0.6739102 161.84128
3 (A) 0.5288474 127.00406
4 (H)-(G) 0.4874209 117.05539
5 (I) 0.4101081 98.48852
6 (H)-(A) 0.3389709 81.40474
7 (A)-(G) 0.3003057 72.11920
Computed on 262 event sequences
Constraint Value
count.method COBJ