我在弹性搜索中索引PDF文档而不使用官方插件,我使用PHP库将PDF内容解析为纯文本。这个PHP库允许我按页面获取文档内容,所以我希望我的搜索页面会检索一些类似于的高亮显示:
[Page 1] ...搜索中突出显示的文字... [第4页] ...第4页中与搜索匹配的突出显示文字...
他们给我的映射是这样的,我只是将文本从字符串转换为数组:
properties: {
highlight:{
text: [ "Page1Content...", "Page2Content...", "Page3Content...", ...],
other_fields: {}
},
other_fields: {}
}
但是在获取突出显示的内容时我找不到获取数组索引的方法,它会在路上丢失。
嵌套/对象是我搜索时知道页码的唯一方法吗?我也不知道在突出显示时是否丢失了数组键。我想过类似或类似的东西:
highlight : {
text: {
"Page1" : "Page1Content",
"Page2": "Page2Content",
....
},
other_fields: {}
}
提前致谢。