我在h2o中读取文件时遇到了一些问题。
import h2o
from h2o.estimators.deeplearning import H2ODeepLearningEstimator
h2o.init()
train = h2o.import_file("("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"")
splits = train.split_frame(ratios=[0.75], seed=1234)
dl = H2ODeepLearningEstimator(distribution="quantile",quantile_alpha=0.8)
dl.train(x=range(0,2), y="petal_len", training_frame=splits[0])
print(dl.predict(splits[1]))
UPDATE_1,第四行有这种形式(抱歉,我从IDE中复制了错误):
train = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv")
我得到H2OTypeError:参数x
应该是None |整数|字符串| list(string | integer)| set(整数|字符串),得到范围范围(0,2)。
这是因为"训练"是空的。
In [23]: train
Out[23]:
我认为阅读和链接以及手动下载文件存在问题。
train = h2o.import_file("iris_wheader.csv")
但我的结果相同。
In [26]: train
Out[26]:
我连接了熊猫并在熊猫中打开了这个.csv。它打开了,我有一个pandas-dataframe,我用了
train = h2o.H2OFrame(train)
并得到一列空车。
In [29]: train
Out[29]:
如何解决这个问题?
UPDATE_2当我转到127.0.0.1:54321/flow/index.html时,它显示数据框已加载到群集中。但在Python中,我得到了空车。我使用Spyder IDE和IPython控制台,它能以某种方式影响结果吗?
答案 0 :(得分:0)
此行存在问题:
train = h2o.import_file("("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"")
你有额外的" (应该是:
train = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv")
然后您会看到train
和print(train)
提供输出:
In [6]: train
Out[6]: sepal_len sepal_wid petal_len petal_wid class
----------- ----------- ----------- ----------- -----------
5.1 3.5 1.4 0.2 Iris-setosa
4.9 3 1.4 0.2 Iris-setosa
4.7 3.2 1.3 0.2 Iris-setosa
4.6 3.1 1.5 0.2 Iris-setosa
5 3.6 1.4 0.2 Iris-setosa
5.4 3.9 1.7 0.4 Iris-setosa
4.6 3.4 1.4 0.3 Iris-setosa
5 3.4 1.5 0.2 Iris-setosa
4.4 2.9 1.4 0.2 Iris-setosa
4.9 3.1 1.5 0.1 Iris-setosa
[150 rows x 5 columns]
In [7]: train.nrow
Out[7]: 150
In [8]: print(train)
sepal_len sepal_wid petal_len petal_wid class
----------- ----------- ----------- ----------- -----------
5.1 3.5 1.4 0.2 Iris-setosa
4.9 3 1.4 0.2 Iris-setosa
4.7 3.2 1.3 0.2 Iris-setosa
4.6 3.1 1.5 0.2 Iris-setosa
5 3.6 1.4 0.2 Iris-setosa
5.4 3.9 1.7 0.4 Iris-setosa
4.6 3.4 1.4 0.3 Iris-setosa
5 3.4 1.5 0.2 Iris-setosa
4.4 2.9 1.4 0.2 Iris-setosa
4.9 3.1 1.5 0.1 Iris-setosa
[150 rows x 5 columns]