排序最有可能由列表顶部的人员说出的积极词汇列表以及列表末尾很少说出的积极词汇列表

时间:2015-12-05 07:04:26

标签: c++ c

我有一个积极的单词列表,该列表有超过1000个单词。是否有任何方法可以对列表中的单词进行排序?有什么想法在C ++或C中怎么做? 如果我有静态数百万的csv tweets文件和positive.txt文件,这是否可以进行排序比较?

1 个答案:

答案 0 :(得分:2)

这称为自组织列表。假设您有一个数据集,Knuth提供了两种算法:

  • 每当您找到用过的单词时,请将其与列表中的前任(如果有)交换

OR

  • 每次找到使用过的单词时,请将其与列表中的顶部项目进行交换。

处理完数据集后,您的列表应该或多或少地自组织成使用频率。