R

时间:2017-11-15 13:05:00

标签: r linear-regression

我是R的新手,我有一个使用线性回归的任务,我们必须生成2个不同的模型,看看哪个是更好的预测疼痛。第一个模型只是为了包含年龄和性别。第二个模型是包含额外的变量;国家特质焦虑量表评分,疼痛灾难评定量表,注意力注意意识量表,以及salivia和血清(血液)中皮质醇水平的测量。

研究问题指出,我们需要进行层次回归,建立一个包含年龄和性别作为疼痛预测因子的模型(模型1),然后建立一个具有预测因子的新模型:年龄,性别,STAI,疼痛灾难性,正念和皮质醇测量(模型2)。因此,模型1中使用的预测变量是模型2中使用的预测变量的子集。完成两个模型后,需要进行比较以评估模型2中与模型1相比是否获得了关于疼痛的实质性新信息。

我在"性爱"中遇到了很多问题。作为一个变量,有人编写了一个" 3"而不是男性和女性,虽然我已经排除了分数," 3"仍然是数据集中的一个级别,有没有办法删除它?

此外,我如何转换"性别"进入一个因素"输入矢量而不是"字符"向量?分类变量可以是模型中的预测变量吗?我试图使用以下命令执行此操作,但它继续返回错误。

sex_vector <- c("female", "male") etc.
factor.sex.vector <- factor(sex.vector)

以下是数据集的摘录:

data.frame': 156 obs. of 10 variables:
$ sex : Factor w/ 3 levels "3","female","male": 2 2 3 3 3 3 3 2 2 2 ...

1 个答案:

答案 0 :(得分:0)

消除不需要的值,然后按照mt1022的建议再次应用因子:

factor.sex.vector <- subset(factor.sex.vector, factor.sex.vector != 3)
factor.sex.vector <- factor(factor.sex.vector)