Autokeras的AutoModel和GraphAutoModel需要解释

时间:2019-12-12 09:14:41

标签: machine-learning keras deep-learning automl auto-keras

我了解AutoKeras ImageClassifier(https://autokeras.com/image_classifier/

clf = ImageClassifier(verbose=True, augment=False)
clf.fit(x_train, y_train, time_limit=12 * 60 * 60)
clf.final_fit(x_train, y_train, x_test, y_test, retrain=True)
y = clf.evaluate(x_test, y_test)

但是我无法理解AutoModel类(https://autokeras.com/auto_model/)的功能,或者它与ImageClassifier有何不同

autokeras.auto_model.AutoModel(
inputs,
outputs,
name="auto_model",
max_trials=100,
directory=None,
objective="val_loss",
tuner="greedy",
seed=None)

参数输入和输出说明文件

  
      
  • 输入: HyperNode实例的列表。 AutoModel的输入节点。
  •   
  • 输出: HyperHead实例的列表。 AutoModel的输出头。
  •   

什么是 HyperNode实例

类似地,什么是GraphAutoModel类? (https://autokeras.com/graph_auto_model/

autokeras.auto_model.GraphAutoModel(
inputs,
outputs,
name="graph_auto_model",
max_trials=100,
directory=None,
objective="val_loss",
tuner="greedy",
seed=None)

文档阅读

  

由HyperBlocks图定义的HyperModel。 GraphAutoModel是HyperModel的子类。除了HyperModel属性外,它还具有用于调整HyperModel的调谐器。用户可以以与Keras模型类似的方式使用它,因为它还具有fit()和预报()方法。

什么是HyperBlocks? 如果Image Classifier自动执行HyperParameter Tuning,则GraphAutoModel的用途是什么?

链接到任何文档/资源,以便更好地理解AutoModel和GraphAutoModel。

1 个答案:

答案 0 :(得分:0)

最近与autokeras合作,我可以分享我的一点知识。

  1. Task API 在执行经典任务(例如图像分类/回归,文本分类/回归...)时,您可以使用自动keras提供的最简单的API,称为Task APIImageClassifierImageRegressor,{ {1}},TextClassifier,...在这种情况下,您只有一个输入(图像,文本或表格数据,...)和一个输出(分类,回归)。

  2. TextRegressor 但是,当您遇到例如需要多个输入/输出体系结构的任务时,则无法直接使用Task API,这就是AutomodelAutomodel一起起作用的地方。您可以查看提供的示例in the documentation,其中有两个输入(图像和结构化数据)和两个输出(分类和回归)

  3. I/O API GraphAutomodel的工作方式类似于keras功能API。它组装了不同的块(卷积,LSTM,GRU等),并使用此块创建模型,然后它将根据您提供的这种架构寻找最佳的超参数。例如,假设我要使用时间序列作为输入数据来执行二进制分类任务。 首先让我们生成一个玩具数据集:

GraphAutoModel

这里,x是一个100个样本的时间序列,每个样本都是一个长度为7且特征维为3的序列。相应的目标变量y是二进制(0,1)。 使用GraphAutomodel,我可以使用所谓的import numpy as np import autokeras as ak x = np.random.randn(100, 7, 3) y = np.random.choice([0, 1], size=100, p=[0.5, 0.5]) 指定所需的体系结构。有很多块:转换,RNN,密集,... check the full list here。 就我而言,我想使用RNN块来创建模型,因为我有时间序列数据:

HyperBlocks

(如果您不熟悉上述模型定义样式,则应查看keras功能API文档)。

因此,在此示例中,我具有更大的灵活性来创建要使用的体系结构骨架:LSTM块,然后是密集层,然后是分类层,但是我没有指定任何超参数,(lstm的数量)层,致密层数,lstm层大小,致密层大小,激活函数,辍学,batchnorm等。),Autokeras将根据我提供的架构(骨架)自动进行超参数调整。