如何优化弹性搜索索引中的重复数据

时间:2016-09-08 11:28:42

标签: elasticsearch

我在弹性搜索索引中插入非常大的JSON。问题是我们如何在elasticsearch索引中优化JSON。     例如我的json格式:

{
  "@context": "Context",
  "@type": "SessionEvent",
  "actor": {
    "@context": "Context",
    "@id": "554433",
    "@type": "Person",
    "name": null,
    "description": null,
    "extensions": {},
    "dateCreated": "2015-08-01T06:00:00.000Z",
    "dateModified": "2015-09-02T11:30:00.000Z"
  },
  "action": "action#LoggedIn",
  "object": {
    "@context": "Context",
    "@id": "viewer",
    "@type": "SoftwareApplication",
    "name": "ePub",
    "description": null,
    "extensions": {},
    "dateCreated": "2015-08-01T06:00:00.000Z",
    "dateModified": "2015-09-02T11:30:00.000Z"
  }
}

这些类型的JSON在每秒/分钟内插入到弹性搜索中,具有相同的actor或具有不同动作的不同actor。 那么如何将这些信息存储在弹性搜索中呢?

  1. 目前存储在elasticsearch?
  2. 或者我们可以将JSON的重复部分存储在其他索引中并将其引用放在上面的JSON中吗?
  3. 请建议哪种方法会更好。

0 个答案:

没有答案