我很想知道分区通常是查询目标的数字列是否有性能优势。目前我有一个包含约5000万条记录的物化视图。当使用常规b树索引并通过此数字列进行搜索时,我得到的成本为7,查询结果的时间约为0.8秒(使用非准备缓存)。为该列添加全局散列分区(具有64个分区)后,我得到的成本为6,查询结果大约为0.2秒(同样使用非预备缓存)。
我的第一反应是分区索引提高了查询的性能。但是,我意识到这可能只是巧合,可能完全依赖于搜索的值,或者其他我不知道的值。所以我的问题是:将一个全局散列分区添加到大型表上的数字列是否有性能优势,或者是确定要扫描的索引分区的成本 - 通过仅对一个全范围扫描的成本进行权衡非索引分区?
我确信这与许多Oracle问题一样,可以通过“它取决于”来回答。 :)我有兴趣了解我应该考虑哪些因素来确定每种方法的好处。
谢谢!
答案 0 :(得分:4)
我很确定你在研究中找到了这个参考 - Partitioned Tables and Indexes。但是,如果有人感兴趣,我会给它一个链接,这是一个关于分区的非常好的材料。
直截了当 - 分区索引只是将索引分解为多个部分(在您的情况下为16)并根据散列分区键扩展数据。当您想要使用它时,Oracle会“计算”密钥的哈希值并确定继续搜索的部分。
知道索引搜索是如何工作的,对于真正庞大的数据我认为最好选择分区索引以减少遍历的索引树(常规索引)。它实际上取决于表中的数据(如何组成常规索引树),并且比起始节点的常规树遍历更快地进行散列和直接跳转到下层节点。
最后,您必须对测试结果更有信心。如果一种技术在您的确切数据上提供了比其他技术更好的结果,则不必担心实现它。