在linux上索引大型数据集的最便宜方法(最好使用sphinx)

时间:2012-03-26 03:39:16

标签: database linux indexing sphinx

我有一个包含1.5亿个产品的数据库,我想使用sphinx对这些数据进行索引,但只有~2 GB的RAM,有没有可行的方法使用sphinx索引所有这些数据,但保持在2 GB以下?

我只需要索引产品名称,产品描述和品牌。虽然我确实有几个属性,但那些不需要搜索。

2 个答案:

答案 0 :(得分:1)

更改ondisk_dict http://sphinxsearch.com/docs/current.html#conf-ondisk-dict

这样只加载了少量数据。狮身人面像根本不需要太多记忆。

使用属性docinfo时,可以使用它来控制它们 http://sphinxsearch.com/docs/current.html#conf-docinfo

通过setLimit函数减少max_matches也应该减少运行时内存使用量。

答案 1 :(得分:0)