这是数百万数据的自动提取的有效数据库

时间:2011-02-01 04:09:08

标签: database nosql redis tokyo-cabinet kyotocabinet

我需要知道对于拥有大约8000万条记录的自动提示数据库来说哪个数据库是最好的数据库...

    1)Redis
    2)tokyoCabinet
    3)Kyoto Cabinet

2 个答案:

答案 0 :(得分:3)

此网站可能包含您所需的内容:http://perfectmarket.com/blog/not_only_nosql_review_solution_evaluation_guide_chart

您需要考虑以下几点:

  1. 数据量 - 数据库应该能够处理大量记录和大文件
  2. 列表项
  3. 插入和检索的速度
  4. 稳定性 - 你不想失败,因为你正在通过大量的点击来攻击数据库,这与autosuggest相同
  5. 我知道它不在您的列表中,但我会选择MongoDB。如果你不能,那么我会选择Redis,只是速度因素。

答案 1 :(得分:2)

Redis非常适合autosuggest,因为它的排序集(实现为跳过列表)。我成功使用的模式基本上将每个部分单词作为键(因此“python”将映射到键:“py”,“pyt”,“pyth”,“pytho”和“python”)。与每个键相关联的数据是一个有序集,其中值用于提供原始短语的词法排序(提供结果的排序),键是映射到您希望返回的数据的id。然后我将id和数据存储在哈希中。

schema

这是一个用python编写的示例项目,其中包含更多详细信息:https://github.com/coleifer/redis-completion