PostgreSQL:GIN还是GiST索引?

时间:2008-08-22 05:22:40

标签: postgresql indexing gin gist-index

从我能找到的信息中,他们都解决了同样的问题 - 更多深奥的操作,如数组包含和交集(&&,@>,< @等)。但是我会对何时使用其中一种(或两者都不可能)的建议感兴趣 PostgreSQL documentation有一些关于此的信息:

  • GIN索引查找速度比GiST快三倍
  • GIN索引的构建时间比GiST要长三倍
  • GIN索引的更新速度比GiST慢十倍
  • GIN索引比GiST大两到三倍

但是,当内存到索引大小比率开始变小(即索引大小变得比可用内存大得多)时,我会特别感兴趣知道是否存在性能影响?我在#postgresql IRC频道上被告知GIN需要将所有索引保留在内存中,否则它将无效,因为与B-Tree不同,它不知道从磁盘读入哪个部分一个特定的查询?问题是:这是真的(因为我也被告知与此相反)? GiST是否有相同的限制?在使用其中一种索引算法时,我应该注意其他限制吗?

1 个答案:

答案 0 :(得分:15)

首先,您是否需要将它们用于文本搜索索引? GIN和GiST是某些数据类型的索引。如果您需要索引简单的char或整数值,那么正常的B-Tree索引是最好的 无论如何,PostgreSQL文档有GIST的章节和GIN的章节,您可以在其中找到更多信息。
最后但并非最不重要的是,找到最佳方法的最佳方法是生成样本数据(尽可能多地为实际场景),然后创建GIST索引,测量创建索引所需的时间,插入新值,执行示例查询。然后删除索引并使用GIN索引执行相同操作。比较这些值,您将获得所需的答案,具体取决于您的数据。