如何使用python在弹性搜索索引中存储键值对

时间:2016-04-14 06:36:16

标签: python elasticsearch

我想将dict的内容存储到elasticsearch索引中,如下所示。这是正确的还是有更好的方法。

    def process(self, inputDict):
       for k, v in inputDict.items():
        # for each key-value pair, store it as a field and string inside the specified index of elastic search.
          key1=k
          value1=v
          doc={
            "key1" : "value" ,
            }
          self.es.index(index='test-index2',doc_type='exdoc', id=1, body=doc)
    pass;

1 个答案:

答案 0 :(得分:0)

首先:您是否尝试过代码?我试了一下,它运行没有错误。这意味着索引test-index2中必定有一些文档。在idle内运行我得到了以下输出:

{'_index': 'test-index2', '_type': 'exdoc', '_id': '1', '_version': 1, '_shards': {'failed': 0, 'total': 2, 'successful': 1}, 'created': True}
{'_index': 'test-index2', '_type': 'exdoc', '_id': '1', '_version': 2, '_shards': {'failed': 0, 'total': 2, 'successful': 1}, 'created': False}
{'_index': 'test-index2', '_type': 'exdoc', '_id': '1', '_version': 3, '_shards': {'failed': 0, 'total': 2, 'successful': 1}, 'created': False}

在那里看到_version字段?这看起来很可疑。使用

sense查询弹性搜索
GET test-index2/exdoc/_search
{
  "query": {
    "match_all": {}
  }
}

将为您提供以下输出:

{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 1,
    "hits": [
      {
        "_index": "test-index2",
        "_type": "exdoc",
        "_id": "1",
        "_score": 1,
        "_source": {
          "key1": "value"
        }
      }
    ]
  }
}

那里只有一个文件:{"key1": "value"}。因此,您始终发送相同的文档 - 忽略inputDict中的键和值 - 对于相同的ID(id=1)和elasticsearch。我想你想要这样的东西:

def process(self, inputDict):
       i = 1 
       for k, v in inputDict.items():
        # for each key-value pair, store it as a field and string inside the specified index of elastic search.
          doc={
            k: v
            }
          self.es.index(index='test-index2',doc_type='exdoc', id=i, body=doc)
          i += 1