正如主题建议我想创建基于张量流的随机森林回归,使用python作为包含以下列的数据集:
酒店名称(文字和分类),国家(文字分类)。检查(文本..?),日期(连续或分类不确定...)和一些连续值列。 我的问题是:
我们上面提到的数据类型的确切类别应该是什么,并且是必要功能的任何映射/离散化(例如,如果有10个国家/地区,我们将它们映射到整数1-10)< / p>
我们如何实现随机森林张量流模型?我在互联网上搜索但只找到了虹膜数据集随机森林示例(只有连续数据)。在估算器api中,可以指定每列的值的类型,但这对tensor_forest不起作用吗?我该如何实施?
感谢并祝大家新年快乐!