Lucene的索引文件包含一个后缀.cfs的复合文件,该文件包含几个不同的数据结构,这些数据结构以前是分开的文件:https://lucene.apache.org/core/3_0_3/fileformats.html#file-names
尽管在性能上有些奇怪,但我发现700GB索引中只有10到15GB映射到RAM,尽管事实上有更多可用RAM(实际上是空闲/待机,这是Windows)。
因此,我希望看到上面链接中提到的不同数据结构所使用的磁盘空间,以便能够判断15/700是否很好。
是否可以将复合文件分成多个部分(仅用于分析,而不能用于Lucene)?还有另一种方法来获取不同组件使用的磁盘空间吗?这是Elasticsearch 2.4索引。 Elasticsearch在任何地方都有统计信息吗?