文本分类分类指针

时间:2011-11-24 22:29:20

标签: text machine-learning data-mining classification categorization

我正在尝试开发一个非常简单的程序,用于使用各种算法对文档进行分类和分类。我的问题,因为我是一个初学者是我找不到好文章或网站的简单教程如何开始它。我已经阅读了很少的资源,我学到了很多东西,但每个文档,网站等我读它使用不同的技术,它以不同的方式分析问题,提出不同的解决方案等所以我感到困惑。是否有任何好的资源可以指向我以便开始实际实施?

此外,我正在寻找实际测试数据,特别是分类的文档,以便我可以“提供”我的算法。任何帮助赞赏。感谢。

1 个答案:

答案 0 :(得分:1)

对于Python,请查看scikit-learn tutorial on text classification。另请参阅demo scripttwenty newsgroups基准数据集上运行数十种不同文本分类算法(包括朴素贝叶斯和SVM)的tutorial。 [免责声明:我共同写了这些东西。]

对于Weka,这是一个{{3}}。