如何在R中编码随机分类数据

时间:2019-09-20 10:42:25

标签: r

我正在尝试开发一种主要针对日期时间和信息的极非线性随机数据的算法。

我应该将此信息分类,因为它们主要包含错误,因此我将数据分为4行,即日期,时间,操作和反馈。但是这些动作包含400多个级别。所以我想使用K-means来创建一个聚类以减少这种观察,并使用其他算法对其进行处理。

我的问题是:

  1. 如何将这些类别转换为数值类别,以便可以轻松地应用K-means机器学习模型或任何分类方法?
  2. 是否可以使用此文本数据并获得我的结果?如果是,请您建议一种方法 我已经尝试过model.matrix方法,但是它只是增加了m数据框的维数,并且还尝试使用class来生成此数据的数值。
  3. 我可以使用数字数据应用ML算法并很好地表示我的结果吗?

这在新列中为我提供了460多个变量

occ.matrix <- model.matrix(~$Action-1, data = data.Protokol)

这给了我列中所有变量的数值

x <- unclass(data.Protokol$Action.new)

因此,根据代码,我处理了缺失的变量,并希望继续进行分析和分类。请问用这种类型的数据处理这种挑战的最佳方法是什么。 我是否继续使用类别的数值? @camile

0 个答案:

没有答案