标签: python classification cluster-analysis text-classification
我有一个二进制字符串列表和两个不在列表中的中心字符串。 我想围绕中心字符串对该列表进行分类,以创建两个群集。列表的字符串将分配给中心最接近该字符串的字符串(汉明距离作为度量标准)。 我已经看到有算法,如邻居分类器,k-medoids,亲和力传播,但是所有这些过程都是自己计算质心的。我必须改用中心字符串。
有什么建议吗?
答案 0 :(得分:0)
仅使用您的中心进行1-近邻分类。
这里不需要任何特殊的东西。只需分配到最近的中心即可。