我正在为数千个文档编制索引。我正在使用python + mysql。
我已经从文档生成了一个索引列,单词,我将它们以下列格式存储在MySQL数据库中。
word_index | document_id
danger | 1
los angeles | 2
paint | 1
paint | 2
paint | 3
paint | 4
monday | 1
monday | 2
monday | 3
monday | 4
数据库中有大约5亿行。
因此,当我查询“星期一”时,结果将返回大约50,000行进行处理。所以,它非常慢。
我可以做些什么来加快这个过程?搜索引擎如何处理其庞大的索引数据库?
欢迎任何提示或提示。