H2o Parser问题

时间:2018-01-31 08:57:49

标签: h2o

使用H2o 3.16.0.4解析Kaggle Toxic数据分类器竞争。即使将解析器用作csv和分隔符作为“,”,也不会解析数据。如果这是与产品相关的错误或某些配置丢失,请告诉我。

1 个答案:

答案 0 :(得分:1)

问题可能是注释字段有太多新行,所以不幸的是更改分隔符无济于事。

作为一种解决方法,您可以使用pandas.read_csv()(正确解析)导入带有pandas的csv(注意:它在data.table::fread()中不能用作reported here)。

要在H2O中使用数据框进行建模,您只需将数据框转换为H2O帧(在Python中使用df = h2o.H2OFrame(my_pandas_frame)

我创建了一个JIRA ticket,以便跟踪和处理此问题。