构建索引以获得最快读取响应的最佳方法是什么?

时间:2008-09-16 00:17:07

标签: indexing

我需要索引最多500,000个条目以便快速阅读。索引需要定期在磁盘上重建。我试图在一个简单的文件,如磁盘上的哈希或嵌入式数据库中的单个表之间做出决定。我不需要RDBMS引擎。

7 个答案:

答案 0 :(得分:1)

我假设您指的是关系型DBMS上的索引表(如mySql,Oracle或Postgres)。

索引是辅助数据存储,用于按特定顺序记录表的字段子集。

如果您创建索引,则包含在其WHERE子句中编入索引的字段子集的任何查询都将执行得更快。

但是,添加索引会降低INSERT性能。

通常,除非它们被破坏,否则不需要重建索引。它们应该由DBMS动态维护。

答案 1 :(得分:1)

也许BDB?这是一个高性能。不使用DBMS的数据库。

答案 2 :(得分:1)

如果按键存储状态对象,Berkeley DB

怎么样

答案 3 :(得分:1)

cdb如果数据没有变化。

/阿伦

答案 4 :(得分:1)

PyTables Pro声称“对于不需要快速更新或删除的情况,OPSI可能是最好的索引引擎之一”。但是我个人并没有亲自使用它,但是PyTables的F / OSS版本已经为您提供了良好的性能:

http://www.pytables.org/moin/PyTablesPro

答案 5 :(得分:0)

这就是MapReduce的发明。 Hadoop是一个很酷的java实现。

答案 6 :(得分:0)

如果数据不需要完全是最新的,您可能还想考虑使用数据仓库工具进行OLAP(例如MSOLAP)。可以根据预先计算的数据执行闪电般快速只读查询。