如何在Python中可靠地获取Elasticsearch索引大小

时间:2017-02-10 11:39:38

标签: python python-3.x elasticsearch

我目前正在使用Python脚本从twitter流接收推文并将其发送到Elasticsearch索引。我的下一步是尝试构建某种形式的安全措施,一旦索引达到所需的文件大小(比如2GB),就会停止流式处理。我已经获得了以字节为单位的商店大小,但是这个大小在流式传输完成后大大减少了(我的知识有限,我认为Elasticsearch正在优化索引),这使我实际上少于所需的文件大小。

有没有可靠的方法来查找确切的文件大小,并将其用作停止流的方法?

我最初的想法是在一定数量的推文之后停止流媒体,但这是不可靠的,因为每条推文的大小不同,没有提供可靠的方法来确保它不超过文件大小。

0 个答案:

没有答案