我正在构建一个数据库,我不确定是否需要任何特殊的索引工具,或者只需要mysql索引就足够了。
在我的数据库中,我将有大约1000篇文章,每篇文章包含大约300个单词。我需要搜索包含我查询中大部分单词的文章(例如:“走路,走路,上学,学习” - 我想找到包含这些单词的文章。)
文章将是HTML。
该应用程序将被少数人(10)一次使用=对超快响应没有额外要求,我只是希望它在合理的时间内返回,例如1秒。
那么,我是否需要任何额外的索引工具(Apache Lucene / SOLR)或mysql索引呢?
答案 0 :(得分:1)
我不能说我是一名MySql专家,因为我更多地处理TSQL。但是我要说只是搜索文章可能需要一段时间,如果他们也包含HTML,因为你必须考虑可能会或可能不会格式错误的标签,具体取决于HTML的保存方式。
在文章表中我个人有一个额外的列,其中包含文章的纯文本版本,或者某种加权算法的结果,该文章在文章中列出了最常见的30个单词,以便您有一个更整洁和流线型的搜索领域可供使用。
但是对于1000篇文章来说,这看起来非常过分,如果你所有的后续工作都是如此,那么MySQL应该做得很好。 1s响应时间。