文本挖掘和机器学习

时间:2016-11-06 18:40:07

标签: machine-learning nlp cluster-analysis text-mining named-entity-recognition

我有一个单词和文本的数据集,我想制作聚类(通过K-means)或任何其他无监督/监督学习方法来区分单词,例如,'John'这个词将被归类为名称(和将与其他人名称聚集在一起),'巴西'作为一个地方等... 有没有我可以用来解决问题的模型。 我听说过N-gram,但我不知道如何在x,y图或其他情况下绘制Ngrams概率 P.S如果你有任何精彩的例子

1 个答案:

答案 0 :(得分:0)

word2vec和嵌入怎么样?
https://deeplearning4j.org/word2vec

相关问题