使用html将文档存储到弹性搜索

时间:2015-08-20 16:43:29

标签: c# html elasticsearch

我试图在删除html后用一些内容索引弹性搜索。搜索后我找不到合适的例子。

我见过这个:

http://elasticsearch-users.115913.n3.nabble.com/Strip-HTML-on-indexing-does-not-store-results-td3039614.html

并且: https://github.com/elastic/elasticsearch/issues/1026

没有跟进。我的问题,我应该在索引之前剥离html还是在弹性搜索中有自定义内容来完成这项工作?

1 个答案:

答案 0 :(得分:-1)

您可以使用html strip filter。它确保您搜索的内容仅在HTML的文本上(而不是div或body标签文本),并将HTML作为结果返回