将数据集上的字符串要素值转换为MATLAB中的数值

时间:2012-10-17 21:32:58

标签: string matlab dataset

我有一个像

这样的数据集
5.7,2.9,4.2,1.3,Iris-versicolor
6.2,2.9,4.3,1.3,Iris-versicolor
5.1,2.5,3.0,1.1,Iris-versicolor
5.7,2.8,4.1,1.3,Iris-versicolor
6.3,3.3,6.0,2.5,Iris-virginica
5.8,2.7,5.1,1.9,Iris-virginica
7.1,3.0,5.9,2.1,Iris-virginica

我希望将该数据集上的字符串值转换为整数值,如

5.7,2.9,4.2,1.3,0
6.2,2.9,4.3,1.3,0
5.1,2.5,3.0,1.1,0
5.7,2.8,4.1,1.3,0
6.3,3.3,6.0,2.5,1
5.8,2.7,5.1,1.9,1
7.1,3.0,5.9,2.1,1

因此Iris-versicolor变为0并且Iris-versicolor变为1

我怎么能在Matlab中实现这个实用建议呢?

1 个答案:

答案 0 :(得分:2)

如果您的数据在单元格数组中,即

data = {...
5.7,2.9,4.2,1.3,'Iris-versicolor'
6.2,2.9,4.3,1.3,'Iris-versicolor'
5.1,2.5,3.0,1.1,'Iris-versicolor'
5.7,2.8,4.1,1.3,'Iris-versicolor'
6.3,3.3,6.0,2.5,'Iris-virginica'
5.8,2.7,5.1,1.9,'Iris-virginica'
7.1,3.0,5.9,2.1,'Iris-virginica'};

您可以按如下方式创建所需的输出(从grp2idx的输出中减去1,因为它从1开始计数(这是您在使用Matlab时可能要采用的做法)):

[cell2mat(data(:,1:end-1)),grp2idx(data(:,end))-1]

    5.7000    2.9000    4.2000    1.3000         0
    6.2000    2.9000    4.3000    1.3000         0
    5.1000    2.5000    3.0000    1.1000         0
    5.7000    2.8000    4.1000    1.3000         0
    6.3000    3.3000    6.0000    2.5000    1.0000
    5.8000    2.7000    5.1000    1.9000    1.0000
    7.1000    3.0000    5.9000    2.1000    1.0000