如何在文档中查找相关术语

时间:2016-01-07 08:44:13

标签: nlp information-retrieval hierarchical-clustering information-extraction

想要将相关字词集中到我的查询字词中。术语应该是相关的,而不是相似的含义。举个例子来说就是印度' ,我想集中相关术语,如宝莱坞' ,'泰姬陵' ,' Kari' ,'尼泊尔' '中国'这代表了与术语“印度”的一些联系。 。

我使用术语的频率来聚类相关的术语,即在我的查询术语(印度)的同一文档中术语的出现次数越多,它就越有可能被关联。但问题是它还涉及来自文档的动词,页面标记,引用关键字等

我的问题是:

1)如何使这项技术可靠并避免不相关的条款?

2)除此之外,最简单但最可靠的技术是什么?

0 个答案:

没有答案