按时聚类文档

时间:2014-05-21 12:09:30

标签: machine-learning cluster-analysis temporal

我在不同时间创建了许多文档。我想暂时集群这些文件。

我想将文档聚类成具有相关时间戳的文档组。例如,如果在时间X创建的文档数量存在“峰值”,则它们将被分组到同一个集群中,依此类推......

假设我们不知道可能有多少个集群。

1 个答案:

答案 0 :(得分:1)

如果你不知道有多少簇,那么增加新的气体就是很好的算法。 您可以在此处使用演示:http://www.demogng.de/

在你的任务中,你需要一箱。

您可以在此处找到其中一项实施:https://github.com/BelBES/libGNG