为弹性搜索索引实现LSA

时间:2017-05-19 10:55:36

标签: java stanford-nlp elasticsearch-plugin elasticsearch-5 lsa

我刚刚花了几天时间围绕为弹性搜索索引的文档实现潜在语义分析。 第一步是建立术语 - 文档矩阵。所以我认为使用stanford nlp库作为输入,索引含义降低,删除停用词,可能生成矩阵或者只使用elasticsearch java api构建它?

1 个答案:

答案 0 :(得分:0)

是的,您可以使用_analyze弹性搜索的终点并对文字执行tokenizing/character mapping/stemming/...并获得结果。