Couchbase索引大小

时间:2018-09-23 08:45:34

标签: couchbase

我有一个群集和一个节点。

社区版本5.1.1内部版本5723。 我试图弄清楚磁盘要求。

我有大约 3.2亿个文档, 250 GB 的数据(压缩后) 和4个 GSI 索引。

文档密钥长60个字符,而索引密钥长42个字符和一个数字(长)。

使用{“ defer_build”:true},在tx-history(from,blockNumber)中创建索引index_tx_from

当我使用单个 2 Tera SSD 时,我的磁盘空间不足。

我删除索引,仅运行其中一个(如上例所示),大小达到 800 gig ,但压缩后,仅在 100 gig

此特定索引将保存所有文档,其余索引将较小。

如我所见,我需要1 tera ssd的数据,2 tera?甚至更多(单独的磁盘)用于索引,但这只是压缩要求的原因。

我的问题是:

  1. 如何计算最准确的磁盘大小。
  2. 减小尺寸的最佳方法是什么

    • 文档密钥不能短一些

谢谢, 阿迪。

1 个答案:

答案 0 :(得分:2)

以下是Couchbase的一般大小调整准则:

https://docs.couchbase.com/server/5.5/install/sizing-general.html

Couchbase使用Snappy库以压缩格式存储文档。这样做已经有一段时间了(从3.x版本开始,如果我没记错的话)。 CB 5.5 Enterprise Edition中的新功能处理RAM中的文档压缩。这是每个存储桶的设置。

您的特定设置存在一些性能问题:

  • 在键/值操作和N1QL查询混合的单个节点上运行大型数据集。至少,您应该考虑具有足够RAM,CPU和磁盘空间的多个节点。
  • 您应该考虑优化索引。您的帖子中的索引定义将有效地包含3.2亿条记录。这是一篇可以帮助您入门的文章(请查看部分索引部分):https://blog.couchbase.com/indexing-best-practices/

Couchbase N1QL指南中还提供了大量N1QL信息(可通过PDF下载):https://blog.couchbase.com/a-guide-to-n1ql-features-in-couchbase-5-5-special-edition/