我正在使用基于K-Means的文本聚类技术。我有一个向量空间模型,它是float的n维数组。我干dry了将其绘制在图中的想法。另外,在绘制之后,我的最终需要是对图中的每个数据点都进行标记(主要使用文本文档的文件名)。我的作品受到https://www.codeproject.com/Articles/439890/Text-Documents-Clustering-using-K-Means-Algorithm的启发 如果有人可以帮助绘制文本聚类,那将是一个很大的帮助。
答案 0 :(得分:0)
一个人不能简单地走进mordor 绘制高维数据。
您的屏幕只有2d,文本尺寸高且稀疏。
您可以尝试PCA,tSNE等,但不要指望它们能像低维连续数据一样好用。