使用H2o 3.16.0.4解析Kaggle Toxic数据分类器竞争。即使将解析器用作csv和分隔符作为“,”,也不会解析数据。如果这是与产品相关的错误或某些配置丢失,请告诉我。
答案 0 :(得分:1)
问题可能是注释字段有太多新行,所以不幸的是更改分隔符无济于事。
作为一种解决方法,您可以使用pandas.read_csv()
(正确解析)导入带有pandas的csv(注意:它在data.table::fread()
中不能用作reported here)。
要在H2O中使用数据框进行建模,您只需将数据框转换为H2O帧(在Python中使用df = h2o.H2OFrame(my_pandas_frame)
。
我创建了一个JIRA ticket,以便跟踪和处理此问题。