Question

深度学习模型是否支持多标签分类问题或H2O中的任何其他算法？

<script src="https://ajax.googleapis.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>

<label>Enter value below:</label>
<br>
<input type="text" id="input1" placeholder="enter value">

将它们映射到字典的键上之后：然后

响应变量如下所示：

Orginal Response Variable -Tags:

apps, email, mail
finance,freelancers,contractors,zen99
genomes
gogovan
brazil,china,cloudflare
hauling,service,moving
ferguson,crowdfunding,beacon
cms,naytev
y,combinator
in,store,
conversion,logic,ad,attribution

谢谢

Answer 1

否，H2O仅包含可一次预测单个响应变量的算法。您可以将每个唯一的组合变成一个单独的类，然后以此方式训练一个多类模型，或者使用单独的模型来预测每个类。

Answer 2

创建给您“财务，自由职业者，承包商，zen99”作为一组输入，而为“ cms，naytev”提供另一组输入的模型的任何算法都过于适合。您需要退后一步，思考一下您的实际问题是什么。

但是，取而代之的是一个想法：在答案词上训练一些词嵌入（或使用一些经过预训练的词嵌入）。然后，您可以对每组值的向量求平均值，并希望这能为您提供“主题”的良好数字表示形式。然后，您需要将您的100维平均单词向量转换为一个数字（想到PCA）。现在，您可以为机器学习算法指定一个数字，并且可以预测。

您仍然有一个问题：已经预测了一个数字，如何将该数字转换为100维矢量，然后从那里转换为主题，再从那里转换为主题词？棘手的，但并非并非不可能。

（顺便说一句，如果将上述“单数”转化为一个因子，并让机器学习模型进行分类，以预测与之前所见主题最相似的主题，那么您基本上已经绕了一个完整的圈，将获得与the one you started with that has too many classes相同的模型。）

是否有H2O算法支持多标签分类？

2 个答案: