我正在考虑开发一种服务,可以使用几个基于NLP的概念来丰富任意文本,例如POS标记或word2vec向量。
它应该稍后扩展到本体。
我想知道是否存在一些如何表达"表达"不同的"陈述"以及#34;令牌"," lemmas"形式的文本或本体。
我用谷歌搜索了一些东西,但没有成功。
也许有人可以给我一些提示。
答案 0 :(得分:0)
不确定理解“表示”的含义,但也许T-SNE是您可能想要查看的内容。
例如:http://cs.stanford.edu/people/karpathy/tsnejs/wordvecs.html
另外this stackoverflow post给出了一个使用gensim& amp; TSNE in python
答案 1 :(得分:0)
我找到了UIMA(http://uima.apache.org/)标准,它能够表达任意"注释"的文字。 所以这允许表达: - lemmas - 代币 - word2vec - 概念
答案 2 :(得分:0)
DKPro Core提供统一的基于UIMA的类型系统,它统一表达语言。它们为不同的NLP框架提供了几个包装器,以便轻松地进行交换。
看看their typesystem。例如,DKPro Core为引理,令牌,POS,命名实体等提供了一种类型。