是否有标准用NLP概念注释文本

时间:2017-12-10 14:11:54

标签: stanford-nlp opennlp

我正在考虑开发一种服务,可以使用几个基于NLP的概念来丰富任意文本,例如POS标记或word2vec向量。

它应该稍后扩展到本体。

我想知道是否存在一些如何表达"表达"不同的"陈述"以及#34;令牌"," lemmas"形式的文本或本体。

我用谷歌搜索了一些东西,但没有成功。

也许有人可以给我一些提示。

3 个答案:

答案 0 :(得分:0)

不确定理解“表示”的含义,但也许T-SNE是您可能想要查看的内容。

例如:http://cs.stanford.edu/people/karpathy/tsnejs/wordvecs.html
另外this stackoverflow post给出了一个使用gensim& amp; TSNE in python

答案 1 :(得分:0)

我找到了UIMA(http://uima.apache.org/)标准,它能够表达任意"注释"的文字。 所以这允许表达:   - lemmas   - 代币   - word2vec   - 概念

答案 2 :(得分:0)

DKPro Core提供统一的基于UIMA的类型系统,它统一表达语言。它们为不同的NLP框架提供了几个包装器,以便轻松地进行交换。

看看their typesystem。例如,DKPro Core为引理,令牌,POS,命名实体等提供了一种类型。