使用功能散列

时间:2015-09-16 15:03:43

标签: machine-learning azure-machine-learning-studio

我在azure机器学习工作室创建了一个实验,这个实验是使用多类神经网络算法的多类分类问题,我还添加了特征哈希'模块将英文文本流转换为一组表示为整数的特征。我已成功运行实验,但当我将其作为Web服务端点发布时,我收到了消息"将输入和输出列的总数减少到小于1000并再次尝试发布。" 经过一些研究,我了解到功能散列将文本转换为数千个功能,但问题是我如何将其作为Web服务发布?而且我不想删除特征哈希'模块。

1 个答案:

答案 0 :(得分:2)

听起来你正在尝试输出所有数千列作为输出。你真正需要的只是得分概率或得分标签。要解决此问题,只需从分数模型模块中删除所有特征哈希列。要做到这一点,请添加一个项目列模块,并告诉它以" no columns"开头。然后"包括"通过"列名",然后添加预测列(得分概率/得分标签)。

然后将该项目列模块的输出连接到Web服务输出模块。您的Web服务现在应该只返回1-3列而不是数千列。