这一天,我研究了信息检索(特别是关于文本检索)。 我想制作一个搜索引擎。但我对倒置索引和向量空间模型的标题事项感到困惑(此外,布尔模型等......用于将文档表示为向量)
我认为Inverted Index是Vector Space Model的可选功能,因为这个索引模型可以帮助程序更有效地获取术语(或单词) ....这是我的想法......是吗?
请发表评论。
答案 0 :(得分:0)
文档 - 术语矩阵和反向索引是保存文档的方法。 保存文档后,您可以使用向量空间模型或语言模型作为搜索引擎的检索模型。
此外,如果您只需要一个使用某些数据制作的搜索引擎并从头开始实施它不是您的观点,那么您可以使用Apache Lucene。