如何使用斯坦福大学的CoreNlp进行单词嵌入?

时间:2018-12-31 09:27:04

标签: java vectorization stanford-nlp word-embedding

我正在使用CoreNlp从大文本中提取信息。但是,它使用“三重”方法,其中单个句子会产生很多输出,这很好,但是有些句子没有意义。我试图通过运行另一个无监督的NLP来消除这种情况,并尝试利用CoreNlp中的功能,但我仍然坚持从CoreNlp获取单词向量。谁能指出我需要从哪里开始搜索在CoreNlp中嵌入单词的代码?我也是Java和IT的新手。

有一些开放的库,例如Gloves,word2vec,text2vec,但是我注意到CoreNlp中已经使用了手套(如果错了,请更正我)。

1 个答案:

答案 0 :(得分:1)

由于从头开始训练自己的模型可能是一项耗时的任务,因此您可以从以下位置下载经过预先​​训练的向量: https://nlp.stanford.edu/projects/glove/

但是,这里有一个dl4j的示例可能会欺骗: https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/nlp/glove/GloVeExample.java