TensorForest分类功能

时间:2017-03-11 13:37:34

标签: python tensorflow random-forest categorical-data

看起来像TensorFlow中的随机森林实现TensorForest,以某种方式支持分类特征作为输入(没有单热编码)。

然而,目前尚不清楚如何使用它们。

如果你看一下这个例子

第65行的'x'参数

必须是一个浮点数组。

我如何传递分类功能(例如字符串)?

1 个答案:

答案 0 :(得分:0)

将SKCompat包装器用于估算器时,' x'并且' y'参数确实需要浮点数(因为使用该接口只能传入一个对象)。但是,使用大多数示例使用的估计器输入函数接口(input_fn = ...),input_fn返回的特征字典可以是浮点数,整数和字符串张量的混合。浮点被视为连续的,整数和字符串被视为分类(创建x [i] == T决策节点而不是x [i]< = T)并且不需要单热编码。因此,您需要创建一个返回批量数据的输入函数(这就是SKCompat接口本质上为您所做的)。