标签: apache-spark machine-learning yarn benchmarking k-means
我正在多节点集群中运行k-means,我想知道如何在运行时访问数据。它是否执行随机访问,并且包含数据的文件是否正在缓存中?