我有一个超过20GB的csv文件。我可以使用readlines读取前几行,然后找出我要导入的列。是否可以使用h2o.importFile()
或h2o中的其他方式仅导入这些列,以便我不加载不必要的列?
答案 0 :(得分:2)
function chkMemName() {
var valMemName = document.getElementById('<%= txtMemName.ClientID %>').value;
if (valMemName.length == 0) {
alert("member name missing!!!");
txtMemName.focus();
return false;
}
}
<label>MEM NAME</label>
<input type="text" maxlength="200" runat="server" id="txtMemName" autocomplete="off" />
<asp:Button ID="btnAddFamily" runat="server" OnClientClick="chkMemName(); return false;" ClientIDMode="Static" formnovalidate="formnovalidate" OnClick="btnAddFamily_Click" Text="ADD" />
函数不支持仅加载列的子集。以下是一些解决方法:
h2o.importFile()
参数来忽略某些列。 x
fit <- h2o.gbm(x = good_cols, y = y, training_frame = train)
newdf <- df[, good_cols]
工具(example here)很容易做到这一点。 cut