如何解决R中运行KModes算法的错误

时间:2017-10-09 04:55:28

标签: r cluster-analysis

我正在研究分段问题,我有一个包含49个变量和500000个观测值的数据帧,可以是连续的,二进制的或分类的。我只读取那些没有任何NA值的变量。另外,为了安全起见,我还使用了na.omit选项。

现在由于数据集太大,我试图逐步运行它并在1000,10000和50000行进行采样。它使用以下代码在1000和10000行上成功运行:

t1c <- t1[sample(nrow(t1),50000),-c(5,23,25,26,28,55)]
library(klaR)
segments <- kmodes(na.omit(t1c),4, iter.max = 5)

其中t1是我的原始数据帧。当我用50000行运行时,我收到以下错误

Error in match.arg(useNA) : 'arg' must be of length 1

知道这里可能存在什么问题。

P.S。此外,我尝试使用daisy()运行PAM,因为它可能更适合我,因为我正在研究更多关于我的数据类型,但我仍然想知道kmodes是否运行10000个样本,50000可能存在什么问题

0 个答案:

没有答案