我一直在尝试使用h2o.deeplearning将数据点权重添加到我的分析中。
以下代码
library(h2o)
x <- rnorm(1000)
y <- x-x^2+rnorm(1000,sd=0.2)
w <- vector(length=1000) #weights vector
w[] <- 1
dfx <- data.frame(x,y,w)
h2o.init()
dfx <- as.h2o(dfx)
H <- h2o.deeplearning(x = 1, y = 2,training_frame=dfx,weights_column = 3, hidden=c(5,4))
给予
Error in .h2o.checkAndUnifyModelParameters(algo = algo, allParams = ALL_PARAMS, :
"weights_column" must be of type character, but got numeric.
将weights_column'3'替换为'w'可获得相同的结果。我尝试了as.character(w),但绝对不喜欢这样。
将weights_column替换为dfx [,3]或dfx $ w得到:
Error in args$x_ignore[!(weights_column == args$x_ignore)] :
invalid subscript type 'environment'
这个错误让我挠头,因为它似乎与在任何其他模型中实现这种事情的方式不同。我没有找到谷歌对此错误的引用,并且documentation没有给出任何进一步的解释。
答案 0 :(得分:0)
好的,提交此问题后,我很快就尴尬地解决了这个问题。对于其他有类似问题的人来说,还是值得的。
weights_column必须由h2o.data.frame中列的 name 指定。即它必须用引号引起来。它不能是其他h2o对象或列的索引。以下代码有效。
library(h2o)
x <- rnorm(1000)
y <- x-x^2+rnorm(1000,sd=0.2)
w <- vector(length=1000) #weights vector
w[] <- 1
dfx <- data.frame(x,y,w)
h2o.init()
dfx <- as.h2o(dfx)
H <- h2o.deeplearning(x = 1, y = 2,training_frame=dfx,weights_column = "w", hidden=c(5,4))