应用错误收集

时间：2019-09-04 23:50:17

标签： python amazon-web-services elasticsearch

我正在 t2.small节点和10gb EBS卷上使用AWS Elasticsearch。每隔5分钟，我会索引约5000个文档*。对于每个文档，我都手动传递唯一ID。由于大多数文档都已更新，因此几乎所有文档都可能有版本2或3 。

值得一提的是，每天我都会执行delete_by_query操作来删除一周以上的文档。

通常，批量插入的延迟小于1秒。但是今天突然之间，在短短几个小时内进行了两周的测试之后，延迟时间才增加到 3分钟，以便批量插入5000个文档。

我正在使用elasticsearch-py和awsauth。

我检查了AWS Cluster运行状况统计信息。自从出现了大容量插入延迟问题以来，旧垃圾回收时间似乎急剧增加。这些之间似乎存在关联。

如何处理此问题？是因为维护文档的多个版本还是使用查询删除功能？

答案 0 :(得分：1)

这并不奇怪，但是仅仅因为变量太多，很难给您一个完整的答案。要考虑的一些事情：