这是我的代码
colClasses <- c("integer", rep("factor", 2140))
> train_categorical <- fread(file.path(data_dir, "train_categorical.csv"),
data.table=FALSE, na.strings="", showProgress=TRUE , colClasses=colClasses,drop="Id")
Read 1183747 rows and 2140 (of 2141) columns from 2.494 GB file in 00:07:35
Error in .subset2(x, j) : subscript out of bounds
我认为这是关于colClasses的,但我对R来说是个新手,无法让它发挥作用。
我该怎么办?请帮助,谢谢。
答案 0 :(得分:1)
最近的data.table更新我们不能同时使用colClass和dropId。
test_categorical <- fread(file.path(data_dir, "test_categorical.csv"), data.table=FALSE,
na.strings="", showProgress=TRUE,colClasses=colClasses)
test_categorical$Id <- NULL
对我有用。