Watson自然语言分类器 - 使用类的比例

时间:2016-04-20 01:29:00

标签: ibm-cloud ibm-watson nl-classifier

使用Watson的NLC API时,是否可以为类使用比例?例如,1-5评级或是/否/可能分类?

我的训练数据包含一系列新闻标题。对于每一个人,我都有一个“有趣”,有点有趣,非常有趣的“课程”。我想根据他们过去发现的有趣内容来预测读者是否会感兴趣的标题。因为感觉更像是回归模型预测1到3之间的数字,我想知道分类器是否能够正常运行这个应用程序。想法?

1 个答案:

答案 0 :(得分:2)

是的,您可以使用1-5评级(使用5个类别),如果它可以工作或不工作,很难说,因为它取决于您的数据: - )

但这是一种完全有效的方法。

NLC将在幕后做的是从每个文本样本中提取含义,使用基于内部维基百科的本体计算一些语义距离,并且它将尝试基于每个示例文本的概念创建分类器。

因此,如果在您的文本示例中,每个群集之间存在内在的语义差异,则使用5个类别将起作用,因此分类器可以正确地收集相关内容并将不同内容区分开来。

这里使用了相同的逻辑,in this recipe,使用Watson Image分类器而不是NLC,但逻辑是相同的。