我们正在使用弹性搜索(带有Ingest Attachment处理器插件的5.5.2版),并尝试为以下HTML内容建立索引。
<div dir="ltr">looks like elasticsearch is not handling the line separator at the end of the first line<div>second line</div></div>\r\n
弹性搜索对内容的索引如下:
“ 看起来elasticsearch没有处理第一行第二行末尾的行分隔符”
如果我们搜索短语“第一行”,那么elastic无法找到上述文档。这是因为在索引内容时,“ line”和“ second”之间的标记被删除,并且两个单词合并为一个单词“ linesecond”。
但是,浏览器将内容显示为两行,如下所示:
looks like elasticsearch is not handling the line separator at the end of the first line
second line
是否可以告诉弹性服务器在索引期间将标签视为换行符?