是否有H2O算法支持多标签分类?

时间:2018-12-08 20:35:08

标签: deep-learning h2o multilabel-classification

深度学习模型是否支持多标签分类问题或H2O中的任何其他算法?

<script src="https://ajax.googleapis.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>

<label>Enter value below:</label>
<br>
<input type="text" id="input1" placeholder="enter value">

将它们映射到字典的键上之后: 然后

响应变量如下所示:

Orginal Response Variable -Tags:

apps, email, mail
finance,freelancers,contractors,zen99
genomes
gogovan
brazil,china,cloudflare
hauling,service,moving
ferguson,crowdfunding,beacon
cms,naytev
y,combinator
in,store,
conversion,logic,ad,attribution

谢谢

2 个答案:

答案 0 :(得分:1)

否,H2O仅包含可一次预测单个响应变量的算法。您可以将每个唯一的组合变成一个单独的类,然后以此方式训练一个多类模型,或者使用单独的模型来预测每个类。

答案 1 :(得分:1)

创建给您“财务,自由职业者,承包商,zen99”作为一组输入,而为“ cms,naytev”提供另一组输入的模型的任何算法都过于适合。您需要退后一步,思考一下您的实际问题是什么。

但是,取而代之的是一个想法:在答案词上训练一些词嵌入(或使用一些经过预训练的词嵌入)。然后,您可以对每组值的向量求平均值,并希望这能为您提供“主题”的良好数字表示形式。然后,您需要将您的100维平均单词向量转换为一个数字(想到PCA)。现在,您可以为机器学习算法指定一个数字,并且可以预测。

您仍然有一个问题:已经预测了一个数字,如何将该数字转换为100维矢量,然后从那里转换为主题,再从那里转换为主题词?棘手的,但并非并非不可能。

(顺便说一句,如果将上述“单数”转化为一个因子,并让机器学习模型进行分类,以预测与之前所见主题最相似的主题,那么您基本上已经绕了一个完整的圈,将获得与the one you started with that has too many classes相同的模型。)