我正在做数据科学(硕士学位)的第一个任务,并不来自编程背景。我已经对数据完成了一个K-Means模型(这是一个简单的测试数据集)。但是,现在我想实现二等分k均值,以显示这如何改善聚类结果。我是用R进行编码的,对于这个领域比较陌生的人,有人对如何用R对等分k均值有任何知识吗?
我要使用的代码是:
bkmeansset <- ml_bisecting_kmeans(x, formula = NULL, k = 3, max_iter = 20,
seed = NULL, min_divisible_cluster_size = 1, features_col = "features",
prediction_col = "prediction", uid =
random_string("bisecting_bisecting_kmeans_"))
我正在输入一个称为“ testset”的测试集,我不确定该在哪里,但在函数的参数中却不确定。我收到的错误消息是:
Error in UseMethod("ml_bisecting_kmeans") :
no applicable method for 'ml_bisecting_kmeans' applied to an object of class
"character"