机器学习:如何一起处理离散和连续数据

时间:2017-05-29 21:33:45

标签: matlab machine-learning classification

我发帖询问是否有任何方法或想法如何处理分类问题中的离散和连续数据。

在我的情况下,我有一堆独立的"批次"有离散数据的。这是与流程相关的数据,因此对于每个批次,都有单独的点。我还有一个数据集,它随同一批次的时间而变化。然而,这次每批次都有很多时间观察。数据集如下所示:

Data Set 1

Batch 1      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 2      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 3      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 4      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)

Data Set 2

Batch 1      t(1)      TimeData
Batch 1      t(2)      TimeData 
Batch 1      t(3)      TimeData
Batch 1      t(4)      TimeData
.
.
.
.
Batch n     (t1)      TimeData
Batch n     (t2)      TimeData
Batch n     (t3)      TimeData

我正在尝试对所有这些数据是否属于' Good'进行分类。批处理,' Bad'批处理,或者“马马虎虎”#39;批量。这由一个特定的离散参数确定(未在数据集中使用)。

我对机器学习很新;任何意见或想法将不胜感激。我正在使用matlab分类学习器来尝试解决这个问题。

1 个答案:

答案 0 :(得分:0)

在处理分类问题时,您需要考虑一些事项。

  1. 培训数据。我们需要用于分类的训练数据,即我们需要所有上述属性的值以及类值,无论它是否为“好”。或者' Bad'或者'马马虎虎'。
  2. 使用这个我们可以训练一个模型,然后给出所有训练属性的新数据,我们可以预测它属于哪个类。
  3. 就离散和连续而言,我们处理离散和连续数据的方式没有区别。实际上,对于这种情况,我们可以生成一个新属性,该属性将是给定批次的所有其他时间变量的函数,然后执行分类。如果您提供数据集的实例,则可以更准确地回答问题。