在Rails中搜索大型数据集

时间:2014-02-18 18:28:50

标签: ruby-on-rails ruby postgresql search bloom-filter

我正在开发一个Rails应用程序。我有一个很大的静态标题数据集(大约3.5M),我正在搜索很多。现在,数据集存储在我的PostgreSQL数据库中,我正在使用postgres的索引和text_pattern_ops进行搜索。这种方法非常快,但我担心它可能无法扩展,因为我的搜索计数应该会迅速增加。

我想将数据集存储在内存中作为数组并使用bloom filtes / aho-coarsick进行搜索,但不确定它是如何或是否是一种好的方法。

基本上,我正在寻找一种快速且可扩展的方法来使用Ruby on Rails在大型数据集中进行搜索。

1 个答案:

答案 0 :(得分:0)

我们使用ElasticSearch,它可以很好地与rails上的ruby集成。 http://www.elasticsearch.org/blog/unleash-the-clients-ruby-python-php-perl/#ruby