从h2o中的csv导入选定的列

时间:2018-05-30 14:46:17

标签: r h2o

我有一个超过20GB的csv文件。我可以使用readlines读取前几行,然后找出我要导入的列。是否可以使用h2o.importFile()或h2o中的其他方式仅导入这些列,以便我不加载不必要的列?

1 个答案:

答案 0 :(得分:2)

function chkMemName() { var valMemName = document.getElementById('<%= txtMemName.ClientID %>').value; if (valMemName.length == 0) { alert("member name missing!!!"); txtMemName.focus(); return false; } } <label>MEM NAME</label> <input type="text" maxlength="200" runat="server" id="txtMemName" autocomplete="off" /> <asp:Button ID="btnAddFamily" runat="server" OnClientClick="chkMemName(); return false;" ClientIDMode="Static" formnovalidate="formnovalidate" OnClick="btnAddFamily_Click" Text="ADD" /> 函数不支持仅加载列的子集。以下是一些解决方法:

  • 加载整个数据集并在任何建模函数中使用h2o.importFile()参数来忽略某些列。 x
  • 加载整个数据集,然后创建一个仅包含所需列的新H2OFrame。 fit <- h2o.gbm(x = good_cols, y = y, training_frame = train)
  • 在磁盘上创建一个仅包含所需列的数据副本。使用newdf <- df[, good_cols]工具(example here)很容易做到这一点。 cut