搜索数据库中的结构化数据(全文+查询)

时间:2012-07-16 10:09:24

标签: python database search full-text-search relational-database

在我工作的应用程序中,我需要在数据库中搜索文本(全文搜索)并根据其他列确定结果的优先级。考虑到性能,哪种数据存储最好?我需要搜索结构化数据并确定结果的优先级。

是RDBMS还是文档存储(Couch,Mongo)还是任何其他NoSQL数据库?或者我应该使用Hadoop等批处理工具并准备搜索数据?

我正在寻找方向。提前谢谢。

1 个答案:

答案 0 :(得分:1)

一个月前,我遇到了类似的问题,并且想知道是否存在一些事实,对nosql解决方案的性能优势负责。

所以我用谷歌搜索比较并找到了这个neat test,这是几天前皮埃尔 - 伊夫的做法。

结论:文档存储似乎在性能方面具有领先优势,但与nosql-solutions一样,您必须牢记权衡。

更新: 我忘了提到的是:皮埃尔也在讨论区分大小写的速度差异。在全文搜索中我无法完全讨论,因为在全文搜索中,您几乎都需要不区分大小写的搜索。也许你所搜索的单词在CAPITAL LETTER中被标记为重要(有一个小s!),你不会发现它们只是一个案例敏感的方法。