我正在尝试开发一种主要针对日期时间和信息的极非线性随机数据的算法。
我应该将此信息分类,因为它们主要包含错误,因此我将数据分为4行,即日期,时间,操作和反馈。但是这些动作包含400多个级别。所以我想使用K-means来创建一个聚类以减少这种观察,并使用其他算法对其进行处理。
我的问题是:
occ.matrix <- model.matrix(~$Action-1, data = data.Protokol)
x <- unclass(data.Protokol$Action.new)
因此,根据代码,我处理了缺失的变量,并希望继续进行分析和分类。请问用这种类型的数据处理这种挑战的最佳方法是什么。 我是否继续使用类别的数值? @camile