使用n-gram模型进行自动文本分类

时间:2013-11-13 06:27:49

标签: data-mining n-gram text-classification

嗨,我是数据挖掘的新手。我的任务是使用n-gram方法自动对文本文档进行分类。

我在这个主题上找不到合适的资源,请帮助我如何继续这个主题,在哪里可以找到基于n-gram分类的教程。

我需要关于这个主题的java源代码供我理解。

提前感谢。

2 个答案:

答案 0 :(得分:3)

我强烈推荐Dan Jurafsky&amp ;;的Stanford's online NLP course。克里斯曼宁。第4章讨论了n-gram,但之前的所有章节都给出了很好的背景知识。

斯坦福大学也有一些很棒的open source software可用于文本分类,从标记化到词性标注。

答案 1 :(得分:2)