我需要使用Python从Elasticsearch检索文档。
所以我写了这个小代码:
es = Elasticsearch(
myHost,
port=myPort,
scheme="http")
request = '''{"query": {"match_all": {}}}'''
results = es.search(index=myIndex, body=request)['hits']['hits']
print(len(results))
>> 10
问题在于,当我预期只有几百个文件时,它仅从索引中返回10个文档。如何从索引中检索所有文档?
答案 0 :(得分:1)
您有几种解决方法。
如果您知道索引中将具有的最大文档数量,则可以将搜索的size
参数设置为该数量或更大。例如,如果您知道少于100,则可以通过results = es.search(index=myIndex, body=request, size=100)['hits']['hits']
如果您不知道该数字,但仍然想要所有这些数字,则必须使用scan
函数而不是search
函数。该文档是here