我正在为我的网站实施基于关键字的搜索。我的数据库包含5种关系:图像,音频,视频,文档和其他文件。它们中的每一个都包含名称,描述,文件大小以及有关该文件的一些其他信息。为了实现基于关键字的搜索,我创建了一个索引表,它基本上包含两列(keywordString,rowId),其中'keywordString'是特定行的字符串类型的所有列的串联,'rowId'是从中开始的行号。获取了列数据(基本上是指向5个关系中的任何一行中的行的指针)。例如(“key1 key2 key3”,“imgR1”)意味着图像表中的第1行在任何列中包含单词“key1”,“key2”,“key3”。 我只是想知道当每个关系中的行数增加到超过100,000或更多时,这是否可以扩展,还是有更好的方法来做到这一点?
还应该从搜索查询中删除哪些单词?我肯定会删除所有重复的单词,文章和连词。