我有来自传感器的数据,我想对该数据运行聚类算法。数据不包含有关群集标签的信息,但是我可以手动添加一些标签。
如何使用手动添加的标签来帮助无监督学习?
一个小例子-使用带有标签的测量作为k均值的初始中心。我可以针对该数据使用哪种基于密度的算法?
答案 0 :(得分:0)
您可以使用init参数选择哪些样本将成为k均值的初始中心(请阅读文档here)。
如果将ndarray传递给init,则其形状应为(n_clusters,n_features)并给出初始中心。在这种情况下,将使用数组as explained here中指定的质心执行一次初始化。
所需的形状意味着init必须精确地包含n_clusters行,并且每行中的元素数量应与Actual_data_points as discussed here的维数匹配。