我在文件夹中的文档很少,我想检查此文件夹中的所有文档是否已编入索引。为此,对于文件夹中的每个文档名称,我想为ES中索引的文档运行循环并进行比较。所以我想要检索所有文件。
retrieve all records in a (ElasticSearch) NEST query和enter link description here这个问题很少有其他可能的重复,但是由于文档从那时起发生了变化,它们对我没有帮助。(当前文档中没有关于扫描的内容)
我尝试使用double
。但根据文档,检索默认数量为10的结果。我想在不提及记录大小的情况下获取所有记录? (因为索引的大小发生了变化)
或者是否可以先获取索引的大小然后将此数字作为输入发送到大小以获取所有文档并循环通过?
答案 0 :(得分:8)
以下是我解决问题的方法。希望这可以帮助。 (参考文献https://www.elastic.co/guide/en/elasticsearch/client/net-api/1.x/scroll.html,https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-scroll.html#scroll-search-context)
List<string> indexedList = new List<string>();
var scanResults = client.Search<ClassName>(s => s
.From(0)
.Size(2000)
.MatchAll()
.Fields(f=>f.Field(fi=>fi.propertyName)) //I used field to get only the value I needed rather than getting the whole document
.SearchType(Elasticsearch.Net.SearchType.Scan)
.Scroll("5m")
);
var results = client.Scroll<ClassName>("10m", scanResults.ScrollId);
while (results.Documents.Any())
{
foreach(var doc in results.Fields)
{
indexedList.Add(doc.Value<string>("propertyName"));
}
results = client.Scroll<ClassName>("10m", results.ScrollId);
}
var response = client.Search<Document>(s => s
.From(fromNum)
.Size(PageSize)
.Query(q => q ....
答案 1 :(得分:0)
您可以轻松执行以下操作以获取索引中的所有记录:
var searchResponse = client.Search<T>(s => s
.Index("IndexName")
.Query(q => q.MatchAll()
)
);
var documents = searchResponse.Documents.Select(f => f.fieldName).ToList();