对未标记的20ng数据集进行分类

时间:2018-01-14 14:43:28

标签: java weka data-mining

我有一个没有标签的未标记的20个新闻组数据集。这是一个多类文本数据集。但我不懂班级标签;我想用weka API对它进行分类。但weka使用类标签对数据集进行分类。链接为20ng dataset

1 个答案:

答案 0 :(得分:0)

您可以使用carrot2中的“lingo clustering algorithm”从原始数据生成标签。

https://project.carrot2.org/algorithms.html