标签: c++ large-data
我已经实现了k-means算法来聚类数据。我使用的数据可能大于我可用的RAM数量。是否有一种常见的方式(在C ++中)来处理这类问题?
答案 0 :(得分:1)
那里有增量的k-means算法:http://www.eecs.tufts.edu/~dsculley/papers/fastkmeans.pdf
C ++源代码:https://code.google.com/p/sofia-ml/