张量流随机森林回归

时间:2018-01-16 07:41:13

标签: python tensorflow regression random-forest

我想实现一个简单的随机森林回归来预测一个值。输入是一些具有多个特征的样本,标签是一个值。但是,我找不到关于随机森林回归问题的简单例子。因此,我看到tensorflow的文件,我发现:

可以训练和评估随机森林的估算器。   例如:

  python
  params = tf.contrib.tensor_forest.python.tensor_forest.ForestHParams(
      num_classes=2, num_features=40, num_trees=10, max_nodes=1000)
  # Estimator using the default graph builder.
  estimator = TensorForestEstimator(params, model_dir=model_dir)
  # Or estimator using TrainingLossForest as the graph builder.
  estimator = TensorForestEstimator(
      params, graph_builder_class=tensor_forest.TrainingLossForest,
      model_dir=model_dir)
  # Input builders
  def input_fn_train: # returns x, y
    ...
  def input_fn_eval: # returns x, y
    ...
  estimator.fit(input_fn=input_fn_train)
  estimator.evaluate(input_fn=input_fn_eval)
  # Predict returns an iterable of dicts.
  results = list(estimator.predict(x=x))
  prob0 = results[0][eval_metrics.INFERENCE_PROB_NAME]
  prediction0 = results[0][eval_metrics.INFERENCE_PRED_NAME]

但是,当我按照示例操作时,我收到错误,prob0 = results[0][eval_metrics.INFERENCE_PROB_NAME],错误显示:

Example conversion:
est = Estimator(...) -> est = SKCompat(Estimator(...))
Traceback (most recent call last):
  File "RF_2.py", line 312, in <module>
    main()
  File "RF_2.py", line 298, in main
    train_eval(x_train, y_train, x_validation, y_validation, x_test, y_test, num_tree)
  File "RF_2.py", line 221, in train_eval
    prob0 = results[0][eval_metrics.INFERENCE_PROB_NAME]
KeyError: 'probabilities'

我认为错误发生在INFERENCE_PROB_NAME上,我看到了document。但是,我仍然不知道替换INFERENCE_PROB_NAME是什么词。

我尝试get_metric('accuracy')替换INFERENCE_PROB_NAME,它会返回错误:KeyError: <function _accuracy at 0x11a06eaa0>

我还尝试get_prediction_key('accuracy')替换INFERENCE_PROB_NAME,它会返回错误:KeyError: 'classes'

如果您知道可能的答案,请告诉我。提前谢谢。

2 个答案:

答案 0 :(得分:0)

我认为您通过提供错误的num_classes=2并且不更改regression=False的默认值而无意中执行了分类问题。请参阅参数部分here。就像快速测试一样,设置num_classes=0regression=True,然后重新运行代码。

答案 1 :(得分:0)

num_classes=0在tensorflow 1.3.0中是错误的。

在Mehdi Rezaie的链接中,num_classes是回归问题的输出中的维数。

对于num_class,您必须使用num_classes=1或更大的值。 否则您会收到类似ValueError: Invalid logits_dimension 0.

的错误