标签: r cluster-analysis hierarchical-clustering euclidean-distance chunking
我想对包含5万行和10个要素/列的混合类型数据进行聚类。我在64位PC上使用R。当我使用“雏菊”函数计算相异度/距离矩阵时,出现“错误:无法分配大小为X GB的向量”错误。
gower_dist <-daisy(df,metric =“ gower”)。
这是生成距离矩阵的命令。如何使用块处理此脚本以避免RAM错误?