将这些数据导入Pandas Dataframe的最简单方法是什么?

时间:2012-11-06 03:51:15

标签: pandas

我遇到了这个数据集:

http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data

我无法找到一种简单的方法将其变为Pandas Dataframe。我手动将其解析为列表列表,然后调用Dataframe构造函数,但有一种更简单的方法。谢谢!

1 个答案:

答案 0 :(得分:6)

尝试使用pandas.read_fwf并指定列宽列表(包括空格):

In [35]: url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data'

In [36]: widths = [7, 4, 10, 10, 11, 7, 4, 4, 30]

In [37]: df = pd.read_fwf(url, widths=widths, header=None, na_values=['?'])

In [38]: df.irow(0)
Out[38]: 
X0                              18
X1                               8
X2                             307
X3                             130
X4                            3504
X5                              12
X6                              70
X7                               1
X8    "chevrolet chevelle malibu"

Name: 0