如何将数据正确导入R中的h2o客户端?

时间:2018-10-15 11:11:47

标签: r bigdata analysis h2o

我正在尝试从RStudio运行n R的客户端将csv上传到h20服务器。看起来像这样:

library(dplyr)
library(ggplot2)
library(h2o)

localH2O = h2o.init(ip = "127.0.0.1", port = 54323)
market_data_file = system.file("extdata", "bank_customer_data.csv", package = "h2o")

market_data  = h2o.importFile(localH2O, path = market_data_file, key = "market_data")

class(market_data)

summary(market_data)

控制台上的输出显示以下内容:

  

market_data_file = system.file(“ extdata”,“ bank_customer_data.csv”,package =“ h2o”)

     

market_data = h2o.importFile(localH2O,路径= market_data_file,键=“ market_data”)   h2o.importFile(localH2O,path = market_data_file,key =“ market_data”)中的错误:     未使用的参数(键=“ market_data”)

     

class(market_data)   错误:找不到对象“ market_data”

     

摘要(市场数据)   摘要错误(market_data):找不到对象“ market_data”

有什么地方做错了吗?

1 个答案:

答案 0 :(得分:0)

key不是h2o.importFile中的参数,这就是为什么出现unused argument错误的原因。这是当前参数

  h2o.importFile(path, destination_frame = "", parse = TRUE, header = NA,
  sep = "", col.names = NULL, col.types = NULL, na.strings = NULL,
  decrypt_tool = NULL)

所有这些都在docs

中进行了说明

正如其他人在注释中指出的那样,h2o软件包中不存在“ bank_customer_data.csv”,这就是system.file不返回任何内容的原因。

您应该尝试使用上述过程导入一个已知存在的文件,然后查看是否适合您。否则,如果要在R包中使用数据集,请查看R文档中的示例,例如

h2o.init(ip = "localhost", port = 54321, startH2O = TRUE)
prosPath = system.file("extdata", "prostate.csv", package = "h2o")
prostate.hex = h2o.importFile(path = prosPath, destination_frame = "prostate.hex")
class(prostate.hex)
summary(prostate.hex)