我正在尝试为我的数据集建立一个连续比率模型,该模型主要具有分类预测变量。我正在使用glmnetcr
软件包。
此外,我将所有类别变量都转换为数值变量,因为否则功能glmnetcr()
将无法正常工作。
我正在尝试拟合此模型:
fit3=glmnetcr(x=trainElective2[,1:20],y=trainElective2[,21])
这给了我以下警告:
from glmnet Fortran code (error code -1); Convergence for 1th lambda value not reached after maxit=100 iterations;
solutions for larger lambdas returned
an empty model has been returned;
probably a convergence issue
这是我的变量类型:
'data.frame': 2503 obs. of 21 variables:
$ Admission.Type : num 3 3 3 3 3 3 1 3 3 3 ...
$ Site : num 1 1 2 1 1 2 2 1 2 2 ...
$ Treatment.Function : num 3 2 3 1 3 1 2 3 1 2 ...
$ Main.Health.Care.Provider.Job.Title: num 2 12 9 15 2 4 2 2 4 5 ...
$ Theatre.Description : num 12 12 14 13 12 16 14 12 16 21 ...
$ ASA.Code : num 3 2 1 1 3 3 1 2 2 2 ...
$ Anaesthetic.Type : num 4 4 4 4 4 4 4 4 4 11 ...
$ Was.Operation.Delayed. : num 2 2 1 1 2 2 2 2 2 2 ...
$ Is.Readmission. : num 1 1 1 1 1 1 1 1 1 1 ...
$ Did.Patient.Die. : num 1 1 1 1 1 1 1 1 1 1 ...
$ Patient.Age.On.Admit : num 58 60 74 83 77 82 66 56 49 49 ...
$ Patient.Sex : num 1 1 1 1 1 1 1 2 1 1 ...
$ Patient.Ethnicity : num 14 11 14 14 14 14 14 11 14 11 ...
$ Patient.Deprivation.Index.Decile : num 8 9 6 6 1 4 2 4 7 7 ...
$ BMI : num 32.4 2.81 23.8 26.7 25.4 ...
$ Smoking.Status : num 2 2 3 2 2 2 2 1 3 2 ...
$ Drinking.Status : num 2 2 2 2 1 2 2 2 2 1 ...
$ DayOfWeek : num 7 2 5 1 1 7 4 2 5 6 ...
$ CodeDescription : num 15 34 1 8 25 8 34 23 21 11 ...
$ OperationDuration : num 111 677 78 169 337 84 252 161 111 166 ...
$ Length.of.Stay..Days. : num 1 5 1 2 3 1 5 1 1 3 ...
此外,我不确定是否应该将分类变量转换为数值变量,但这是我能够解决此错误的唯一方法:y * weights : non-numeric argument to binary operator