标签: machine-learning cluster-analysis mahout spectral
我感兴趣的是在高维数据上运行Mahout中的谱聚类算法。我的问题是如何获取高维数据向量列表并创建最近邻图?这是在Mahout中完成的,还是可以通过地图缩减的方式来做这样的事情。
答案 0 :(得分:0)
在项目中没有类似的东西,而不是制作k-NNG。光谱聚类,是的。是的我确定你可以在MapReduce中实现它。问题是如何做得比蛮力计算k-最近邻居更好。