Question

我是R的新手，我有一个使用线性回归的任务，我们必须生成2个不同的模型，看看哪个是更好的预测疼痛。第一个模型只是为了包含年龄和性别。第二个模型是包含额外的变量;国家特质焦虑量表评分，疼痛灾难评定量表，注意力注意意识量表，以及salivia和血清（血液）中皮质醇水平的测量。

研究问题指出，我们需要进行层次回归，建立一个包含年龄和性别作为疼痛预测因子的模型（模型1），然后建立一个具有预测因子的新模型：年龄，性别，STAI，疼痛灾难性，正念和皮质醇测量（模型2）。因此，模型1中使用的预测变量是模型2中使用的预测变量的子集。完成两个模型后，需要进行比较以评估模型2中与模型1相比是否获得了关于疼痛的实质性新信息。

我在＆＃34;性爱＆＃34;中遇到了很多问题。作为一个变量，有人编写了一个＆＃34; 3＆＃34;而不是男性和女性，虽然我已经排除了分数，＆＃34; 3＆＃34;仍然是数据集中的一个级别，有没有办法删除它？

此外，我如何转换＆＃34;性别＆＃34;进入一个因素＆＃34;输入矢量而不是＆＃34;字符＆＃34;向量？分类变量可以是模型中的预测变量吗？我试图使用以下命令执行此操作，但它继续返回错误。

sex_vector <- c("female", "male") etc.
factor.sex.vector <- factor(sex.vector)

以下是数据集的摘录：

data.frame': 156 obs. of 10 variables:
$ sex : Factor w/ 3 levels "3","female","male": 2 2 3 3 3 3 3 2 2 2 ...

Answer 1

消除不需要的值，然后按照mt1022的建议再次应用因子：

factor.sex.vector <- subset(factor.sex.vector, factor.sex.vector != 3)
factor.sex.vector <- factor(factor.sex.vector)

R

1 个答案: