应用错误收集

如何使用斯坦福大学的CoreNlp进行单词嵌入？

时间：2018-12-31 09:27:04

标签： java vectorization stanford-nlp word-embedding

我正在使用CoreNlp从大文本中提取信息。但是，它使用“三重”方法，其中单个句子会产生很多输出，这很好，但是有些句子没有意义。我试图通过运行另一个无监督的NLP来消除这种情况，并尝试利用CoreNlp中的功能，但我仍然坚持从CoreNlp获取单词向量。谁能指出我需要从哪里开始搜索在CoreNlp中嵌入单词的代码？我也是Java和IT的新手。

有一些开放的库，例如Gloves，word2vec，text2vec，但是我注意到CoreNlp中已经使用了手套（如果错了，请更正我）。

1 个答案:

答案 0 :(得分：1)

由于从头开始训练自己的模型可能是一项耗时的任务，因此您可以从以下位置下载经过预先训练的向量： https://nlp.stanford.edu/projects/glove/

但是，这里有一个dl4j的示例可能会欺骗： https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/nlp/glove/GloVeExample.java