Question

我是ElasticSearch的新手，并尝试使用ElasticSearch ConnectionPool [通过Transport class]的并发连接向ElasticSearch中的索引添加条目。

这是我的代码：

import elasticsearch
from elasticsearch.transport import Transport

def init_connection():
    transport = Transport([{'host':SERVER_URL}], port=SERVER_PORT, randomize_hosts=False)
    transport.add_connection(host=SERVER_URL+SERVER_PORT)
    return transport

def add_entries_to_es(id, name):
    transport = init_connection()
    doc = {
           'name': name,
           'postDate': datetime.datetime.now(),
           'valid': "true",
           'suggest': {
               "input": name,
               'output': name,
               'payload': {'domain_id': id}
               }
           }
    conn = transport.getConnection()
    es = elasticsearch.Elasticsearch(connection_class=conn)
    res = es.index(index=ES_INDEX_NAME, doc_type=ES_DOC_TYPE, id=id, body=doc)
    ...

我得到以下错误：

File "/my_project/elastichelper.py", line 23, in init_connection
transport.add_connection(host=SERVER_URL+SERVER_PORT)
File "/Library/Python/2.7/site-packages/elasticsearch/transport.py", line 139, in add_connection
self.set_connections(self.hosts)
File "/Library/Python/2.7/site-packages/elasticsearch/transport.py", line 169, in set_connections
connections = map(_create_connection, hosts)
File "/Library/Python/2.7/site-packages/elasticsearch/transport.py", line 161, in _create_connection
kwargs.update(host)
ValueError: dictionary update sequence element #0 has length 1; 2 is required

我不确定Transport class是否是在ElasticSearch中实例化ConnectionPool的正确方法。但是，我从文档中读到Transport class处理各个连接的实例化以及创建连接池来保存它们。

我没有得到正确的方法来实例化ConnectionPool并从池中有效地使用连接。阅读和谷歌搜索并没有对我有利。

我也了解helpers.bulk() API，但我对使用它感到困惑，因为在索引中添加条目，我也删除了无效条目。

Answer 1

我发现只使用ElasticSearch类实例，并为{x>我设置了适当的timeout值 timeout=30 就足够了< / em>] index方法有效。像这样：

doc = { 'name': name, 'postDate': datetime.datetime.now(), 'valid': "true", 'suggest': { "input": name, 'output': name, 'payload': {'domain_id': id} } } es = elasticsearch.Elasticsearch() res = es.index(index=ES_INDEX_NAME, doc_type=ES_DOC_TYPE, id=id, body=doc, timeout=30)

我最初遇到了简单timeout类实例的ElasticSearch个问题，这个问题已由上述更改修复。

我根本不必明确使用Transport或Connection类实例。

使用elasticsearch-py库的ElasticSearch ConnectionPool

1 个答案: