标签: python k-means h2o anomaly-detection sparkling-water
在H2O KMeans群集中。有没有办法计算数据集中每个点的聚类质心的实际距离? 目前H2o为传递的数据提供了预测的聚类,但是从点聚类中心获取点距离的最佳方法是什么。
我打算将其用于异常检测,其中远离质心的点被视为异常。我没有使用Apache Spark,但是Intend尝试使用Sparking Water但是H2o Api似乎没有显示从群集质心获得每个点距离的最佳方法。
答案 0 :(得分:0)
不幸的是,目前还没有办法从R或Python中做到这一点。 H2O在Java中有一个方法,但它从未在R / Python中公开过,所以我为here添加了一张票。
与此同时,您可以编写自定义代码来执行此操作,或者您可以使用深度学习自动编码器进行异常检测(例如tutorial中提供的示例)。