对2-by-N数据集进行分类

时间:2012-12-13 10:33:26

标签: matlab cluster-analysis classification

我有一个数据集,比如说Q,具有以下维度(列中的数据是独立的)

Q1                  Q2   
0.676638655462185   0.470588235294118
0.889747899159664   0.976470588235294
0.867478991596639   0.494117647058824
0.886974789915966   0.600000000000000
0.823109243697479   0.435294117647059
0.757226890756303   0.0941176470588235
0.751764705882353   0.235294117647059
0.935294117647059   0.0941176470588235
0.927899159663866   0.576470588235294
0.913109243697479   0.329411764705882
0.888151260504202   0.400000000000000
0.935714285714286   0.305882352941177
0.583781512605042   0.0588235294117647
0.827394957983193   0.141176470588235
0.938823529411765   0.317647058823529
0.941176470588235   0.541176470588235
0.942352941176471   0.164705882352941

我想将其归类为班级p = 0.2 : 0.2 : 1;其中类之间的差异将是20%。对于数据的分类,应考虑这两个值。

我尝试了群集,但群集的结果并不令人信服。我尝试了NEWPR,但仍然无法做任何事情。

我的原始数据由17个实例的42-8-21(总共71个)属性组成。我也从那边尝试过。对于NEWPR,我使用了一些确定性属性 - 一个或两个(在71个中) - 作为目标。即使我尝试将数据库拆分为某个百分位数。由于我的数据没有1/0 ,因此没有结果。

当我采用60%基准和简单逻辑(Q1 > 0.60 & Q2 > 0.60)逻辑时,分类运作良好。我获得的分类结果非常好。在那种情况下,数据的序列化是一个问题,我手动完成。但是,这对我来说并不令人信服,因为需要根据模型对更多数据进行分类。

我不确定是否可以在Matlab中使用(0< Q1 < 0.20 & 0 < Q2 < 0.2)这种逻辑?

否则,我可以使用任何常用的评分系统进行此分类吗?

请帮我找到解决此问题的自定义解决方案。

1 个答案:

答案 0 :(得分:0)

(0< Q1 < 0.20 & 0 < Q2 < 0.2)将被解释为((0<Q1)<.2)&(0<Q2)<.2),仅对于Q1和Q2小于或等于0才为真。 使用((0<Q1)&(Q1<0.2)&(0<Q2)&(Q2<0.2))