我在不同时间创建了许多文档。我想暂时集群这些文件。
即我想将文档聚类成具有相关时间戳的文档组。例如,如果在时间X创建的文档数量存在“峰值”,则它们将被分组到同一个集群中,依此类推......
假设我们不知道可能有多少个集群。
答案 0 :(得分:1)
如果你不知道有多少簇,那么增加新的气体就是很好的算法。 您可以在此处使用演示:http://www.demogng.de/
在你的任务中,你需要一箱。
您可以在此处找到其中一项实施:https://github.com/BelBES/libGNG