ElasticSearch跨键/值

时间:2017-03-09 08:18:30

标签: elasticsearch lucene full-text-search

我正在试图找出在我的文档中进行搜索的最佳方法,现在我有点陷入困境。请记住,我对ElasticSearch很新,现在我主要想看看它是否符合我的需求。

我的数据集最初由XML文献文件组成。这些文件由标识符组成(例如第1段,第2段......第1册,第2册......第1节,第2节,第4节...... [不一定是连续的或实际上是数字。它们大部分时间是匹配的 \ W ])。

我认为我为弹性搜索格式化数据的方式如下:

"passages": [
  {"id": "1.1", "body": "I represent the book 1 section 1 and I am a dog"},
  {"id": "1.2", "body": "I am a cat and I represent the book 1 section 2"},
]

我的研究需求如下:我需要能够搜索段落(所以,如果我正在寻找距离猫不太远的,我会匹配1.1-1.2)并检索查询跨越的第一段和最后一段的标识符。

据我所知,这似乎是一个非常规的用户要求,我在这里看不到任何看法。需要保持标识符和能够发现"段落#34;似乎有点复杂"第一"深入ES ......

感谢您抽出时间阅读问题:)

0 个答案:

没有答案