我正在重构一个执行kmean聚类的C ++代码。有两个版本的代码:
我应该如何有效地实施?方法重载(虽然这不依赖于输入)
好的,这是做kmean聚类的伪代码。我需要实现两个版本的距离和更新功能。
int* kmean_clustering(vector<double[10]> data)
// each row of data hold one data point
// so we have M data points of 10 dimension
{
// Split codebook
// Assignment step
Find the closest codebook based on distance(distance here can be Euclidean, Mahalanobis, .....)
//Update step
}