如何在给定包含文本属性的CSV文件的情况下对数据进行聚类?

时间:2014-01-03 07:15:36

标签: csv text cluster-analysis

我有一个csv文件,其中包含有关文档中单词的详细信息。标题是font-size,font-name,文本的位置,最后是单词。我想将数据中的记录聚类以查看类似格式的单词。 由于font-name等字段有文本信息,我无法继续使用通常的聚类技术。

你能提出任何有价值的想法吗?

由于

0 个答案:

没有答案