我想尝试使用python进行一些操作,并且与R一起使用时,有一个非常方便的功能,可以获取这样的示例数据集
> v <- iris
> v
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
7 4.6 3.4 1.4 0.3 setosa
8 5.0 3.4 1.5 0.2 setosa
9 4.4 2.9 1.4 0.2 setosa
用numpy是否可以生成一些示例数据集来玩耍?
答案 0 :(得分:3)
Scikit learning实际上提供了该数据集(如@sascha所述)。您可以使用load_iris()
:
from sklearn.datasets import load_iris
data = load_iris()
您可以将其放入带有熊猫的数据框中,以更好地复制R:
import pandas as pd
species = [data['target_names'][x] for x in data['target']]
pd.DataFrame(
np.column_stack([data['data'], species]),
columns=data['feature_names'] + ['species']
)