tntsearch软件包的文本分类的准确数据集是什么

时间:2018-09-21 00:05:14

标签: php machine-learning dataset text-classification

我在PHP中找到了一个用于文本分类的程序包,其中分类器的方法接受这样的句子和类别:

$classifier->learn('that was a clean election', 'not sports');
$classifier->learn('that was a nice game','sports');

$classifier->guess('the game was bad');
// returns sports

哪种数据集最适合这种方法? 而且我还有一个动态类别,这意味着我可以添加其他类别。我的问题是我必须在添加的每个类别中都提供示例,这意味着我需要在该类别中添加更多数据。

1 个答案:

答案 0 :(得分:0)

  

为此目的,有很多数据集,in this paper   是有关专业的详细信息,我在以下链接: