seqefsub输出的解释

时间:2019-11-13 16:34:47

标签: r traminer sequence-analysis

尊敬的stackoverflow社区, 我有两个问题,但是我认为它们是相关的。

我在解释seqefsub()函数的输出时遇到问题,该函数是用于序列分析的TraMineR库的一部分。

我的目标是找到最频繁的过渡。为此,我想使用seqefsub()函数。 但是结果令人困惑

  1. 我得到令人困惑的结果,因为在我看来某些子序列是相同的,例如 (H)-(A> G),(H)-(H> A)-(A> G)和(H> A)-(A> G)。这些子序列在哪里不同?

  2. 使用事件序列的transitionstate“表示”,我得到了不同的结果。我希望他们会以不同的方式代表正义。有什么不同的做法?

我希望我只是不理解“子序列”的含义?

感谢您的回答!非常感谢!

数据

seq_data <- structure(list(SEQ_1 = c("H", "H", "H", "H", "H", "H", "H", "H", 
                                  "H", "B", "H", "H", "H", "H", "H", "H", "A", "A", "A", "H", "H", 
                                  "H", "A", "H", "H", "G", "A", "C", "H", "H", "E", "H", "H", "H", 
                                  "H", "H", "A", "H", "H", "B", "D", "H", "H", "H", "G", "G", "H", 
                                  "H", "G", "H", "H", "D", "H", "G", "H", "H", "G", "H", "H", "H", 
                                  "H", "H", "C", "H", "G", "H", "H", "H", "H", "H", "H", "H", "H", 
                                  "H", "H", "A", "H", "H", "H", "G", "H", "H", "H", "H", "H", "G", 
                                  "H", "H", "H", "H", "H", "G", "H", "A", "H", "H", "H", "H", "H", 
                                  "H", "H", "H", "A", "G", "H", "H", "H", "H", "A", "H", "H", "A", 
                                  "H", "H", "H", "B", "H", "H", "H", "H", "H", "H", "H", "A", "G", 
                                  "H", "A", "F", "A", "H", "H", "G", "B", "H", "A", "G", "H", "A", 
                                  "H", "H", "H", "G", "A", "H", "H", "H", "H", "H", "A", "H", "A", 
                                  "H", "H", "H", "G", "D", "G", "H", "H", "A", "H", "C", "H", "H", 
                                  "A", "H", "A", "H", "G", "H", "H", "H", "H", "G", "G", "H", "H", 
                                  "H", "H", "G", "H", "H", "H", "A", "H", "A", "H", "H", "H", "F", 
                                  "H", "H", "H", "H", "D", "G", "H", "H", "G", "H", "H", "H", "G", 
                                  "H", "H", "H", "H", "F", "H", "E", "H", "H", "H", "H", "H", "H", 
                                  "G", "H", "H", "H", "H", "H", "H", "G", "C", "H", "H", "H", "G", 
                                  "H", "H", "H", "H", "H", "H", "H", "H", "H", "A", "G", "A", "H", 
                                  "H", "H", "A", "A", "H", "H", "H", "H", "H", "C", "H", "H", "H", 
                                  "H", "H", "A", "H", "C", "B", "H"),

                        SEQ_2 = c("A", "A", "H", "H", "G", "B", "B", "C", "A", "A", "B", "A", "F", 
                                  "A", "B", "E", "G", "A", "A", "H", "D", "G", "G", "G", "F", "A",
                                  "G", "G", "H", "H", "E", "H", "H", "C", "G", "A", "G", "A", "B", 
                                  "C", "E", "C", "A", "A", "B", "A", "B", "H", "B", "G", "A", "D", 
                                  "A", "A", "H", "A", "G", "B", "B", "H", "A", "A", "C", "A", "G", 
                                  "C", "G", "A", "H", "A", "E", "G", "A", "A", "A", "A", "H", "G",
                                  "E", "A", "G", "A", "B", "A", "B", "G", "A", "A", "D", "B", "A",
                                  "B", "G", "A", "B", "A", "A", "A", "H", "C", "A", "A", "G", "A",
                                  "H", "A", "A", "B", "A", "A", "A", "G", "A", "C", "G", "A", "H",
                                  "A", "G", "H", "B", "A", "A", "A", "A", "G", "G", "F", "G", "H",
                                  "G", "G", "B", "B", "G", "A", "A", "F", "H", "H", "H", "G", "A", 
                                  "A", "F", "A", "A", "A", "B", "A", "A", "G", "A", "A", "A", "F", 
                                  "D", "A", "A", "G", "A", "B", "B", "A", "F", "C", "C", "A", "B", 
                                  "A", "C", "A", "A", "A", "A", "H", "G", "H", "H", "E", "B", "G", 
                                  "G", "B", "B", "A", "C", "A", "A", "F", "C", "C", "G", "C", "G", 
                                  "D", "A", "G", "A", "A", "C", "A", "A", "C", "C", "A", "E", "B", 
                                  "H", "G", "A", "C", "B", "A", "A", "G", "B", "H", "B", "B", "C",
                                  "H", "B", "C", "F", "A", "H", "H", "A", "C", "B", "E", "B", "G",
                                  "B", "C", "G", "H", "A", "G", "A", "C", "A", "A", "A", "B", "B",
                                  "H", "A", "A", "A", "C", "B", "A", "B", "C", "A", "B", "F", "B",
                                  "G", "H"), 

                        SEQ_3 = c("G", "C", "H", "A", "A", "G", "B", "G", "G", "B", 
                                  "G", "G", "G", "G", "B", "D", "G", "A", "A", "A", "G", "G", 
                                  "G", "G", "G", "A", "C", "G", "B", "A", "D", "A", "B", "G", 
                                  "B", "G", "G", "A", "A", "B", "B", "A", "G", "G", "B", "C", 
                                  "G", "B", "G", "C", "B", "G", "A", "G", "B", "A", "A", "B", 
                                  "G", "A", "G", "G", "G", "G", "G", "G", "A", "A", "B", "G", 
                                  "A", "G", "B", "G", "A", "A", "A", "G", "G", "F", "G", "G", 
                                  "G", "A", "B", "G", "G", "G", "G", "G", "A", "B", "C", "G", 
                                  "G", "G", "A", "G", "H", "B", "G", "G", "G", "G", "H", "A", 
                                  "B", "B", "G", "B", "G", "G", "A", "G", "G", "A", "A", "G", 
                                  "B", "B", "G", "B", "A", "A", "A", "A", "G", "E", "G", "B", 
                                  "B", "G", "B", "B", "G", "A", "G", "F", "A", "A", "C", "G", 
                                  "A", "D", "G", "G", "G", "G", "A", "G", "A", "E", "F", "G", 
                                  "A", "F", "E", "A", "A", "G", "G", "B", "G", "A", "F", "G", 
                                  "C", "A", "B", "C", "A", "G", "G", "G", "B", "A", "G", "B", 
                                  "C", "G", "A", "B", "A", "C", "B", "A", "C", "C", "G", "A", 
                                  "A", "G", "G", "F", "G", "G", "A", "G", "A", "B", "B", "A", 
                                  "G", "B", "G", "G", "G", "G", "A", "G", "A", "C", "B", "G", 
                                  "A", "G", "A", "A", "B", "A", "G", "E", "G", "G", "D", "G", 
                                  "A", "B", "G", "A", "B", "E", "G", "G", "G", "B", "A", "H", 
                                  "G", "A", "A", "C", "A", "G", "A", "B", "C", "B", "G", "G", 
                                  "A", "C", "G", "G", "G", "G", "G", "B", "A", "A", "G", "H"),

                        SEQ_4 = c("I", "I", "D", "I", "A", "G", "B", "G", "G", 
                                  "I", "I", "I", "I", "I", "I", "G", "I", "I", "I", "A", "I", 
                                  "I", "G", "G", "G", "G", "I", "I", "I", "I", "G", "G", "B", 
                                  "G", "G", "I", "I", "I", "G", "I", "I", "A", "G", "G", "B", 
                                  "A", "G", "G", "G", "G", "I", "G", "D", "G", "G", "B", "I", 
                                  "A", "I", "G", "G", "G", "G", "I", "I", "G", "I", "G", "D", 
                                  "I", "I", "G", "A", "I", "I", "A", "G", "I", "G", "I", "B", 
                                  "I", "I", "A", "A", "I", "I", "G", "I", "G", "I", "A", "G", 
                                  "I", "G", "G", "G", "G", "F", "I", "G", "I", "I", "I", "G", 
                                  "G", "I", "I", "I", "A", "I", "I", "I", "I", "I", "I", "G", 
                                  "I", "G", "B", "I", "A", "G", "I", "I", "G", "G", "G", "I", 
                                  "G", "G", "G", "I", "I", "G", "G", "I", "G", "G", "A", "I", 
                                  "I", "G", "G", "G", "G", "I", "I", "I", "I", "A", "D", "D", 
                                  "B", "I", "G", "D", "I", "I", "G", "G", "G", "G", "A", "E", 
                                  "I", "I", "A", "B", "C", "I", "I", "I", "G", "I", "G", "I", 
                                  "B", "C", "G", "G", "E", "I", "I", "I", "I", "I", "I", "G", 
                                  "I", "I", "I", "G", "G", "I", "I", "A", "G", "I", "B", "I", 
                                  "A", "I", "C", "G", "I", "G", "I", "G", "I", "A", "G", "I", 
                                  "G", "A", "G", "G", "I", "B", "I", "G", "E", "G", "I", "G", 
                                  "G", "G", "G", "I", "G", "B", "G", "I", "G", "G", "G", "I", 
                                  "B", "I", "G", "I", "G", "I", "G", "I", "B", "F", "I", "I", 
                                  "G", "G", "I", "G", "G", "G", "G", "G", "B", "G", "I", "G", 
                                  "A"),

                        weights = c(1.193572, 1.193572, 1.09698, 0.538388, 
                                    0.532709, 0.503224, 0.547916, 1.113717, 0.838522, 4.31029, 
                                    0.636802, 0.583736, 0.812172, 1.336007, 0.645919, 0.840518, 
                                    0.873673, 0.914939, 0.785616, 0.931976, 0.883077, 0.960107, 
                                    0.917529, 0.629383, 4.602061, 1.224961, 0.819434, 0.640803, 
                                    1.177564, 0.866287, 1.562558, 3.445406, 0.965799, 0.912612, 
                                    0.85224, 0.880838, 1.124291, 0.380731, 0.611555, 0.682449, 
                                    2.372168, 0.907912, 0.667863, 0.808493, 2.612155, 1.192382, 
                                    0.802104, 0.591401, 0.989002, 2.495577, 0.626747, 5.817673, 
                                    1.06499, 1.074385, 1.098698, 0.562646, 0.804422, 0.867366, 
                                    1.281458, 1.257444, 0.9748, 1.94397, 1.658734, 0.662862, 
                                    3.009707, 0.548788, 2.353732, 1.136974, 3.29127, 1.361969, 
                                    1.660908, 0.822089, 1.268331, 0.466967, 0.567991, 0.943077, 
                                    0.542645, 2.339348, 5.817673, 2.708232, 0.924957, 1.282278, 
                                    0.755188, 0.589358, 1.02157, 0.637557, 1.095032, 1.440195, 
                                    1.958251, 0.574594, 1.612123, 0.846205, 0.89196, 0.897915, 
                                    1.705551, 0.674339, 0.629056, 0.61122, 0.64678, 0.657057, 
                                    1.712552, 1.663738, 0.460498, 1.497671, 0.632228, 2.707239, 
                                    0.657453, 1.988879, 2.052185, 0.895819, 0.395689, 0.617422, 
                                    0.767115, 0.504171, 0.537435, 2.359527, 1.044549, 0.606568, 
                                    0.939298, 0.60581, 0.726856, 0.560129, 0.663962, 0.710114, 
                                    0.884856, 0.578279, 0.671561, 1.070634, 0.568689, 1.555666, 
                                    1.452984, 0.796493, 0.631123, 0.980282, 0.721616, 1.41691, 
                                    0.533512, 0.837825, 0.694897, 0.615192, 0.845958, 0.652456, 
                                    0.759874, 0.849237, 2.137318, 1.709901, 2.961245, 0.749306, 
                                    0.887214, 0.727871, 1.377833, 1.376782, 0.56788, 0.716252, 
                                    0.724486, 1.140407, 2.863351, 0.259485, 0.376181, 0.512404, 
                                    0.558134, 0.35126, 0.482967, 0.362673, 0.286031, 0.211678, 
                                    0.210669, 0.300319, 0.189582, 0.184032, 0.195463, 0.308717, 
                                    0.398877, 0.322332, 0.241356, 0.382673, 0.47999, 0.387531, 
                                    0.265036, 0.391882, 0.207302, 0.210859, 0.632957, 0.421592, 
                                    0.2548, 0.856167, 0.991335, 0.260576, 0.288388, 0.349121, 
                                    0.457778, 0.500926, 0.161298, 0.43791, 0.58468, 1.348197, 
                                    0.360234, 0.30861, 0.268749, 0.211672, 0.336972, 0.493954, 
                                    0.472781, 0.767277, 0.47866, 0.395901, 0.249036, 0.394255, 
                                    0.201878, 0.386825, 0.537641, 1.353464, 0.303292, 0.291578, 
                                    0.290027, 0.186347, 0.414038, 0.169934, 0.295007, 0.411577, 
                                    0.370954, 0.261642, 0.357367, 0.60505, 0.378499, 0.404143, 
                                    0.405042, 0.499185, 0.249607, 0.652579, 0.206307, 0.266779, 
                                    0.310588, 0.688845, 0.549567, 0.61294, 1.252536, 1.49619, 
                                    0.790678, 0.694142, 0.506734, 2.962994, 0.64592, 0.597696, 
                                    1.225667, 0.583322, 0.530562, 0.733702, 0.586143, 0.745789, 
                                    0.629701, 0.537692, 0.735431, 0.74955, 0.792095, 1.731894, 
                                    1.334336, 0.68943, 0.227813, 0.518872, 0.406796, 0.264072)
                        ), row.names = c(NA, 262L), class = "data.frame")

顺序和事件顺序

library(TraMineR)
stateSeq <- seqdef(seq_data,
                         var=c("SEQ_1", "SEQ_2", "SEQ_3", "SEQ_4"),
                         cnames=c("0-6", "7-10", "11-13", "14-17"),
                         weights = seq_data$weights)


eventSeq_transition <- seqecreate(stateSeq, tevent="transition") #transition representation
eventSeq_state <- seqecreate(stateSeq, tevent="state") #state representation

sub_transition <- seqefsub(eventSeq_transition, pmin.support = 0.05)
sub_state <- seqefsub(eventSeq_state, pmin.support = 0.05)

sub_transition[1:7]
sub_state[1:7]

输出

> sub_transition[1:7]
      Subsequence   Support     Count
1             (H) 0.6739102 161.84128
2           (A>G) 0.2932808  70.43214
3       (H)-(H>A) 0.2866207  68.83270
4           (H>A) 0.2866207  68.83270
5       (H)-(A>G) 0.2135207  51.27754
6 (H)-(H>A)-(A>G) 0.2040370  49.00001
7     (H>A)-(A>G) 0.2040370  49.00001

Computed on 262 event sequences
   Constraint Value
 count.method  COBJ

> sub_state[1:7]
  Subsequence   Support     Count
1         (G) 0.7212375 173.20705
2         (H) 0.6739102 161.84128
3         (A) 0.5288474 127.00406
4     (H)-(G) 0.4874209 117.05539
5         (I) 0.4101081  98.48852
6     (H)-(A) 0.3389709  81.40474
7     (A)-(G) 0.3003057  72.11920

Computed on 262 event sequences
   Constraint Value
 count.method  COBJ

0 个答案:

没有答案