嗨,我是数据挖掘的新手。我的任务是使用n-gram方法自动对文本文档进行分类。
我在这个主题上找不到合适的资源,请帮助我如何继续这个主题,在哪里可以找到基于n-gram分类的教程。
我需要关于这个主题的java源代码供我理解。
提前感谢。
答案 0 :(得分:3)
我强烈推荐Dan Jurafsky&amp ;;的Stanford's online NLP course。克里斯曼宁。第4章讨论了n-gram,但之前的所有章节都给出了很好的背景知识。
斯坦福大学也有一些很棒的open source software可用于文本分类,从标记化到词性标注。
答案 1 :(得分:2)