在设计布尔值和矢量模型方面需要帮助

时间:2019-05-19 03:02:42

标签: database

假设您已加入搜索引擎开发团队,以基于Vector模型和Boolean模型设计搜索算法。您已经收集了以下文档(非结构化),并计划应用索引技术将其转换为反向索引。

文档1 数据科学是一个跨学科领域,它使用科学的方法,过程,算法和系统从结构化和非结构化各种形式的数据中提取知识和见解。 文件2 数据挖掘是在大型数据集中发现模式的过程,该模式涉及机器学习,统计数据和数据库系统相交处的方法。 文件3 信息系统是对硬件和软件的补充网络的研究,人们和组织可以使用它们来收集,过滤,处理,创建和分发数据。

请设计三个布尔查询(例如,网络AND搜索),并列出每个查询的相关文档。

请使用向量模型查询倒排索引,并将结果与​​布尔模型进行比较。 (提示:您可以使用余弦相似度并设置相似度阈值)。

在Boolen和矢量模型设计中需要帮助

0 个答案:

没有答案