我是lightgbm
软件包的新用户我正在尝试使用以下示例列车数据构建linear regression
模型,其中具有中间房值作为rstudio中的响应变量
housingMedianAge totalRooms totalBedrooms population households medianIncome medianHouseValue
41 880 129 322 126 8.3252 452600
21 7099 1106 2401 1138 8.3014 358500
52 1467 190 496 177 7.2574 352100
52 1274 235 558 219 5.6431 341300
52 1627 280 565 259 3.8462 342200
52 919 213 413 193 4.0368 269700
52 2535 489 1094 514 3.6591 299200
52 3104 687 1157 647 3.12 241400
42 2555 665 1206 595 2.0804 226700
52 3549 707 1551 714 3.6912 261100
52 2202 434 910 402 3.2031 281500
52 3503 752 1504 734 3.2705 241800
52 2491 474 1098 468 3.075 213500
52 696 191 345 174 2.6736 191300
52 2643 626 1212 620 1.9167 159200
50 1120 283 697 264 2.125 140000
并且示例testdata是
50 2239 455 990 419 1.9911
52 1503 298 690 275 2.6033
40 751 184 409 166 1.3578
42 1639 367 929 366 1.7135
52 2436 541 1015 478 1.725
52 1688 337 853 325 2.1806
52 2224 437 1006 422 2.6
请分享代码,使用参数列表在lightgbm
中构建模型,以预测输出。
编辑:将评论中的信息移至问题
train <- as.matrix (train)
test <- as.matrix(test)
dtrain <- lgb.Dataset(data = train(,1:5), label = train[, 6])
params <- list(objective = "regression ", metric = "l2" )
model <- lgb.train(params, train, 100, valids, min_data = 1, learning_rate = 1, early_stopping_rounds = 10)
在与列车数据相关的错误之后,它必须在Dgcmatrix
中答案 0 :(得分:0)
对于第3行,请替换
train(,1:5)
带
train[,1:5]
(方括号)