标签: machine-learning nlp topic-modeling
我需要检查特定网页上内容的相关性。我有成千上万 网页以对此进行检查。检查页面标题是否与页面内容相关的最佳方法是什么。
答案 0 :(得分:1)
当您说:
检查页面标题是否与网页标题相关的最佳方法是什么 页面上的内容。
如何根据您的问题定义相关性?
我不知道这是不是您想要的,但我想到了几件事,它实际上是在比较两个文档的相似程度,一个是文档的标题,另一个是说明。
您可以考虑为两者生成矢量表示并比较它们相似程度的方法。
唯一需要考虑的是,与网页内容相比,标题的大小很小。