我正在尝试编写一些代码来创建一个用于从文件中搜索文本的小应用程序。
应该抓取文件,我需要使用倒排索引来提升搜索量。
我的问题是我对解析器的概念有所了解;我愿意在查询中实现AND,NOT,OR。
然而,我无法弄清楚我的索引应该是什么......我从未创建过反向索引,所以如果有人能提出可行的方法,我会非常感激。我在理论上确实知道它是如何工作的但我的问题是我完全不知道如何在MySql中发生。我也需要为关键字编制索引权重。
答案 0 :(得分:3)
这是一个简单的实现。 http://rosettacode.org/wiki/Inverted_Index
答案 1 :(得分:1)
选择1:Apache Solr / Lucene。选择2:mysql的全文索引支持。