搜索引擎的数据库

时间:2010-08-12 16:10:10

标签: database search-engine

我正在考虑开发一个搜索引擎,但不知道我可以有效使用的后端。请建议我一个数据库,我可以在其中存储数千条记录并以高效的方式查询它们。我正在为自己的兴趣开发搜索引擎,所以请不要给我任何批评的想法,就像通常在类似的问题中找到的那样。

三江源

3 个答案:

答案 0 :(得分:2)

查看Cloudant,它是Apache CouchDB的集群/可扩展部署。 CouchDB是NoSQL计划的一部分(它使用文件系统而不是由数据库服务器抽象存储),并且被告知可以很好地扩展,特别是对于Cloudant,尽管我自己没有尝试过。

显然,对于任何DODB(面向文档的数据库,如Apache所说),您将不得不将您的问题从单独的内存和表索引转移到包含存储容量,尽管使用文件系统意味着您通常能够使用更少的内存(因为内存中存储的信息较少)。这是一个广泛的概括,但你明白了。

答案 1 :(得分:1)

对于数千条记录,标准的rdbms就足够了。对于百万及以上的百万分之一,您可能希望研究替代方案。

但是既然你是为了自己的兴趣而做的,那么每个人都要做一个,这样你才能理解差异。

答案 2 :(得分:1)

MySQL 全文索引是搜索数千条记录的理想解决方案。当您向上扩展并接近100万行时, MySQL全文变得缓慢,您将不得不使用其他方法,例如 Sphinx