文件分类

时间:2011-02-24 13:22:30

标签: nlp document-classification

请建议我根据下面提到的要求对文档进行分类。

我有一组要分类的文件。对于每个分类标签,我都有一组特定于该类标签的术语。

2 个答案:

答案 0 :(得分:0)

好吧,如果你已经有了课程的条款,你可以使用一些不同类型的分类器,例如:一个SVM,一个Naive Bayes Classifier甚至一个Neural Network

有些库包含此分类器,例如wekamahout

稍后我用Naive Bayes分类器编写了一个如何做到这一点的例子:Naive Bayes Example,但这是对概念的解释,而不是真实世界可用的工具。

答案 1 :(得分:0)

当您在文档中附加标签时,这会受到监督学习的影响。您可以使用以下任何分类器来实现文档分类。  1.朴素贝叶斯分类器  2.最近邻居分类器  3.决策树  4.子空间方法

大多数ml库都将具有上述技术的实现。如果您想根据您熟悉的编程语言选择哪个ml库,可以参考此链接。 http://daoudclarke.github.io/machine%20learning%20in%20practice/2013/10/08/machine-learning-libraries/