标签: csv text cluster-analysis
我有一个csv文件,其中包含有关文档中单词的详细信息。标题是font-size,font-name,文本的位置,最后是单词。我想将数据中的记录聚类以查看类似格式的单词。 由于font-name等字段有文本信息,我无法继续使用通常的聚类技术。
你能提出任何有价值的想法吗?
由于