标签: text ranking mining
我在特定域中有一组文本文件。我需要根据某个指标对文件进行排名。
请帮我一些可用于对文本文件进行排名的指标(术语频率,大小,使用频率等)。然后,我想使用文本挖掘技术根据这些技术之一对文件进行排名。
答案 0 :(得分:0)
我遇到的主要问题是根据相关性或其他指标对文档进行排名。
现在我得出的结论是,根据内容(相关性)排名的文档可以提供更好的结果。
我正在利用基于矢量的方法根据查询中给出的搜索词对文档进行排名。我不确定这是否是最佳方法,但它提供的结果具有平均准确度