sklearn SGDClassifier,当没有匹配时可以得到标签?

时间:2017-01-31 07:15:56

标签: python python-3.x scikit-learn classification

我正在使用sklearn SGDClassifier来预测我的数据集。 我的文字不应该被分类在任何标签/类别中,但我很惊讶,如果我提供测试数据作为" kjhd askdhajksdh asd askh",它仍然被分类到给定类别之一。

我也使用了概率,但仍然有可能获得这个垃圾文本。

我的问题是,分类器可以返回类似"找不到匹配的内容"等等这种情况?

1 个答案:

答案 0 :(得分:1)

没有。分类器会将任何输入分类到训练中的一个标签,概率最高,但这些概率很小。

您可以使用decision_function来设置标签的阈值。 类似的东西:

#include<stdio.h>
int main()
{
int *num2;
int value=20;
num2=&value;
printf("\n\n\n%d",*num2);
}