在matlab中选择统计随机数据集进行协同处理的正确方法

时间:2013-04-30 08:24:36

标签: matlab statistics machine-learning classification

我找到了各种方法来找出用于在MATLAB中训练分类器的随机数据集,如crossvalcvpartition等。我已经完成了所有示例,但无法正确理解它们。我想做以下事情:

  1. 我必须将数据集随机分成训练和测试数据集
  2. 然后在训练集中我需要随机选择2个数据点(对于那些熟悉共同训练的人来说是标记数据。)
  3. 最后,我需要获得从分类器中获得的平均准确度。
  4. 编辑:我的数据集看起来像这样:

      

    0.1 0.2 0.2 1 22 40
      0.0 0.1 0.3 0 33 30
      0.5 0.5 0.5 1 10 11

    等等

    此数据集与40行和70列非常相似

1 个答案:

答案 0 :(得分:0)

如果我理解你的问题,你的每一行代表一个特定的记录。如果是这样,你可以尝试这样的事情:

>> training_data = my_dataset(randsample(40,ceil(0.3*40)),:);
>> test_data = my_dataset(setdiff(1:40,randsample(40,ceil(0.3*40))),:);
>> two_points = training_data(randsample(ceil(0.3*40),2),:);