我有一个受审查的数据库,我想在censReg包中使用censReg进行回归,但是我无法为它定义左区间(我已经留下了删失的观察结果)。
我的数据库如下所示:
ID | student | year of education | familysize | age | gender
------+------------+-------------------+------------+-----+----------
1001 | true | 7 | 4 | 20 | 1
1002 | false | 12 | 5 | 25 | 2
1003 | true | 10 | 3 | 26 | 1
1004 | ....
我有这个回归:
censresult <- censReg (eduyears ~ familysize + gender + age + birthorder,
left=0, right=Inf, data=childrenchar)
我想说,如果有人是学生(这意味着学生是真的)那么它就是被审查的观察。
[编辑]我想回顾一下教育年限的人们的一些特征,但是我的数据库中包含没有完成学业但未考虑到这一点的孩子会产生偏倚的结果。这意味着有些孩子仍然是学生。我们得到了他们的信息我说这些孩子是被审查的观察,我使用一个审查回归模型,其中儿童的教育是一个潜在的变量,完全观察到部分观察结果,但未完全观察到观察的其他部分。
答案 0 :(得分:0)
如果这个censReg
(或“sensreg”??)函数在包'生存'中使用'Surv'函数(对于删失数据的许多R回归函数也是这样),那么公式的LHS将是形成为:
# wrong: censReg( Surv( eduyears, student) ~ # rest of RHS covariates, ....
但这是一个猜测,因为你没有包含censReg
来自的包的名称。
所以我查了“censReg”,只有一个名字相同的包有一个具有该名称的函数。并且它似乎没有使用该机制。审查信息提供给“left”参数,因此它将设置为0,因为您的eduyears
变量都是正数。此函数似乎只接受“left”的单个值。 `censReg似乎不支持其非审查观察的变量持续时间。我称之为“截断”而非“审查”分布。所以我认为“学生”不能成为具有该特定功能的审查标志。它可以用作其他R回归函数(在其他包中)的审查指标。
如果问题围绕可能不完整的教育期限进行核算,我会说你已经左截断(0)和右删失观察。如果您考虑依赖变量的“特征”是一个是/否(1/0)变量,那么生存模型可能是可能的。您仍未详细描述研究问题以支持具体建议。您或许应该寻求当地的统计建议。 StackOverflow旨在协助编码问题,具有明确定义的分析方法。 CrossValidated.com用于更一般的统计和分析设计问题。