使用python生成示例(虹膜)数据集

时间:2019-04-04 14:50:14

标签: python numpy

我想尝试使用python进行一些操作,并且与R一起使用时,有一个非常方便的功能,可以获取这样的示例数据集

> v <- iris
> v
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1            5.1         3.5          1.4         0.2     setosa
2            4.9         3.0          1.4         0.2     setosa
3            4.7         3.2          1.3         0.2     setosa
4            4.6         3.1          1.5         0.2     setosa
5            5.0         3.6          1.4         0.2     setosa
6            5.4         3.9          1.7         0.4     setosa
7            4.6         3.4          1.4         0.3     setosa
8            5.0         3.4          1.5         0.2     setosa
9            4.4         2.9          1.4         0.2     setosa

用numpy是否可以生成一些示例数据集来玩耍?

1 个答案:

答案 0 :(得分:3)

Scikit learning实际上提供了该数据集(如@sascha所述)。您可以使用load_iris()

from sklearn.datasets import load_iris
data = load_iris()

您可以将其放入带有熊猫的数据框中,以更好地复制R:

import pandas as pd
species = [data['target_names'][x] for x in data['target']]
pd.DataFrame(
    np.column_stack([data['data'], species]),
    columns=data['feature_names'] + ['species']
)