最佳文本文档分类算法

时间:2015-08-17 17:31:50

标签: machine-learning nlp classification text-mining document-classification

我想知道文本分类的最佳可用算法。我想根据体育,银行,技术等对文档进行分类。请提出好的算法以获得最高的准确性。

1 个答案:

答案 0 :(得分:1)

没有最好的算法。参见"数据挖掘的第四定律 - “NFL-DM”http://khabaza.codimension.net/index_files/9laws.htm

您确实需要一种可以处理多个列的算法。如果需要,列数多于行数。这排除了基于矩阵的算法。

Naive Bayes和SVM是文本分类的热门选择。