我使用序列回归树来检查职业轨迹的差异。无论是在绘图中还是在树的打印描述中,都有缩写,TraMineR帮助菜单和Matthias Studer关于序列回归树/加权簇的论文都没有解释。
您能告诉我以下示例中的以下缩写是什么意思(d-plot对377名参与者超过15年的等级提升情况(30个为期6个月),非常感谢!
PRINTED OUTPUT
Dissimilarity tree:
Parameters: minSize=18.85, maxdepth=3, R=5000, pval=0.01
Formula: matOM ~ Age + Degree + Gender + YearsSinceGrad
Global R2: 0.011589
Fitted tree:
|-- Root (n: 377 disc: 0.55559)
|-> Age 0.011589
|-- <= 48 with NA (n: 260 disc: 0.53812)[(1,20)-(2,8)-(3,2)] *
|-- > 48 (n: 117 disc: 0.57369)[(1,14)-(2,12)-(3,4)] *
问题1:disc =? ( - &gt;在图中等于s2,见下文) 问题2:[(1,20) - (2,8) - (3,2)] * =? (这是最典型的序列吗?)
输出的输出 问题3:s2 =? (等于上面打印输出中的“光盘”)
答案 0 :(得分:2)
感谢您的发言!
问题1:是的,情节中的'disc'='s2'(我必须解决这个问题)。这意味着“差异”。高差异意味着序列中存在许多变化。差异的范围是[0,最大可能距离],因此没有threashold值。但是你可以比较一些值。
Levene测试(在您的情况下似乎不重要,见图)测试差异差异的显着性。可以使用dissassoc
函数运行此测试。在树中,Levene测试终端节点中的差异相等(同样,这里差异似乎不重要)。
问题2:在打印输出中,方括号[]中的序列是质心。这是子组中最的中心序列。
问题3:见问题1的答案。
希望这有帮助。