标签: java stanford-nlp elasticsearch-plugin elasticsearch-5 lsa
我刚刚花了几天时间围绕为弹性搜索索引的文档实现潜在语义分析。 第一步是建立术语 - 文档矩阵。所以我认为使用stanford nlp库作为输入,索引含义降低,删除停用词,可能生成矩阵或者只使用elasticsearch java api构建它?
答案 0 :(得分:0)
是的,您可以使用_analyze弹性搜索的终点并对文字执行tokenizing/character mapping/stemming/...并获得结果。
_analyze
tokenizing/character mapping/stemming/...