应用错误收集

真的很新，但我想我正在寻找K-means来做这件事。

我有一堆带有标签的对象（很多）。他们的其他功能都不重要。我知道类似的对象有类似的标签，它们可以分为＆＃34;类别＆＃34;。我想知道这些类别是什么（使用k-means？）。标签看起来像......

[u＆＃39;品尝＆＃39;，你＆＃39;健康＆＃39;，你＆＃39;食谱＆＃39;，你＆＃39; vietnam＆＃39;，你＆＃39; egg＆＃39;，u＆＃39;汤＆＃39;，...]

[你＆＃39;孩子＆＃39;，你＆＃39;，你＆＃39;健康＆＃39;，你＆＃39;学校＆＃39;，你＆＃39;食谱＆＃39;，你＆＃39;家庭＆＃39;，...]

[u＆＃39;饮食＆＃39;，你＆＃39;舌头＆＃39;，你＆＃39;健康＆＃39;，你＆＃39;美容＆＃39;，你＆＃39;头发＆＃39; ,. ..]

[u＆＃39;锻炼＆＃39;，你＆＃39; athens＆＃39;，你＆＃39; pizzino＆＃39;，你＆＃39; henya＆＃39;，你＆＃39;体重＆＃39;，你＆＃39;损失＆＃39;，...]

使用k-means时，有关于字符串列表的任何教程或指南？订单无关紧要。我希望结果可以返回一组聚类标签？它是如何工作的？谢谢!!