python,h2o.import_file()返回空行

时间:2017-10-23 14:27:17

标签: python h2o

我在h2o中读取文件时遇到了一些问题。

import h2o
from h2o.estimators.deeplearning import H2ODeepLearningEstimator
h2o.init()
train = h2o.import_file("("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"")
splits = train.split_frame(ratios=[0.75], seed=1234)
dl = H2ODeepLearningEstimator(distribution="quantile",quantile_alpha=0.8)
dl.train(x=range(0,2), y="petal_len", training_frame=splits[0])
print(dl.predict(splits[1]))

UPDATE_1,第四行有这种形式(抱歉,我从IDE中复制了错误):

train = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv")

我得到H2OTypeError:参数x应该是None |整数|字符串| list(string | integer)| set(整数|字符串),得到范围范围(0,2)。

这是因为"训练"是空的。

In [23]: train

Out[23]: 

我认为阅读和链接以及手动下载文件存在问题。

train = h2o.import_file("iris_wheader.csv")

但我的结果相同。

In [26]: train

Out[26]: 

我连接了熊猫并在熊猫中打开了这个.csv。它打开了,我有一个pandas-dataframe,我用了

 train = h2o.H2OFrame(train) 

并得到一列空车。

In [29]: train

Out[29]:

如何解决这个问题?

UPDATE_2当我转到127.0.0.1:54321/flow/index.html时,它显示数据框已加载到群集中。但在Python中,我得到了空车。我使用Spyder IDE和IPython控制台,它能以某种方式影响结果吗?

1 个答案:

答案 0 :(得分:0)

此行存在问题:

train = h2o.import_file("("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"")

你有额外的" (应该是:

train = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv")

然后您会看到trainprint(train)提供输出:

In [6]: train
Out[6]:   sepal_len    sepal_wid    petal_len    petal_wid  class
-----------  -----------  -----------  -----------  -----------
        5.1          3.5          1.4          0.2  Iris-setosa
        4.9          3            1.4          0.2  Iris-setosa
        4.7          3.2          1.3          0.2  Iris-setosa
        4.6          3.1          1.5          0.2  Iris-setosa
        5            3.6          1.4          0.2  Iris-setosa
        5.4          3.9          1.7          0.4  Iris-setosa
        4.6          3.4          1.4          0.3  Iris-setosa
        5            3.4          1.5          0.2  Iris-setosa
        4.4          2.9          1.4          0.2  Iris-setosa
        4.9          3.1          1.5          0.1  Iris-setosa

[150 rows x 5 columns]


In [7]: train.nrow
Out[7]: 150

In [8]: print(train)
  sepal_len    sepal_wid    petal_len    petal_wid  class
-----------  -----------  -----------  -----------  -----------
        5.1          3.5          1.4          0.2  Iris-setosa
        4.9          3            1.4          0.2  Iris-setosa
        4.7          3.2          1.3          0.2  Iris-setosa
        4.6          3.1          1.5          0.2  Iris-setosa
        5            3.6          1.4          0.2  Iris-setosa
        5.4          3.9          1.7          0.4  Iris-setosa
        4.6          3.4          1.4          0.3  Iris-setosa
        5            3.4          1.5          0.2  Iris-setosa
        4.4          2.9          1.4          0.2  Iris-setosa
        4.9          3.1          1.5          0.1  Iris-setosa

[150 rows x 5 columns]