使用Watson的NLC API时,是否可以为类使用比例?例如,1-5评级或是/否/可能分类?
我的训练数据包含一系列新闻标题。对于每一个人,我都有一个“有趣”,有点有趣,非常有趣的“课程”。我想根据他们过去发现的有趣内容来预测读者是否会感兴趣的标题。因为感觉更像是回归模型预测1到3之间的数字,我想知道分类器是否能够正常运行这个应用程序。想法?
答案 0 :(得分:2)
是的,您可以使用1-5评级(使用5个类别),如果它可以工作或不工作,很难说,因为它取决于您的数据: - )
但这是一种完全有效的方法。
NLC将在幕后做的是从每个文本样本中提取含义,使用基于内部维基百科的本体计算一些语义距离,并且它将尝试基于每个示例文本的概念创建分类器。
因此,如果在您的文本示例中,每个群集之间存在内在的语义差异,则使用5个类别将起作用,因此分类器可以正确地收集相关内容并将不同内容区分开来。
这里使用了相同的逻辑,in this recipe,使用Watson Image分类器而不是NLC,但逻辑是相同的。