标签: python algorithm cluster-analysis k-means amazon-sagemaker
我正在尝试在SageMaker中实现k均值文档聚类算法。一些问题:
-如何自动化和优化形成的簇数?
-在这种情况下使用文本相似度的最佳方法是什么?
-是否可以参考任何现有的笔记本实现?
谢谢。