我有一个机器学习算法来检测主题是否出现在文档中。该算法首先将针对文档的相关关键短语解码的特征向量返回到主题;其次,该算法将特征向量应用于训练模型,以确定文档是否包含主题。
问题是:使用特征向量,如何在文档中搜索以找出有助于该主题的段落?
以下是特征向量的示例:分数由tf-idf vectorizor生成。
[[' list',' 0.540320306410993'],['商店定位器', ' 0.24341085804857815'],['定位器',' 0.24341085804857815'],['页面', ' 0.546535059695002'],['选择',' 0.15629186365106215'],['显示', ' 0.5161671790502559']]