IndexError:索引2超出了轴1的大小

时间:2017-07-30 15:42:23

标签: python pandas dataframe dataset

我想直接从网站加载数据集到jypyter笔记本,但每次我尝试使用python pandas' read_csv'上传数据集时,都会导入数据集,但我无法从中选择任何列数据集。

这是我的代码:

url = "http://ww2.amstat.org/publications/jse/datasets/fishcatch.dat.txt"
df = pd.read_csv(url, sep= '\t', header= 0)

print df

       1      1     242.0     23.2    25.4    30.0    38.4   13.4   NA
0        2      1     290.0     24.0    26.3    31....                 
1        3      1     340.0     23.9    26.5    31....                 
2        4      1     363.0     26.3    29.0    33....                 
3        5      1     430.0     26.5    29.0    34.... 

这是我尝试访问数据集中的第3列时获得的错误

df[:,2]

IndexErrorTraceback (most recent call last)
<ipython-input-27-910d22bca5b5> in <module>()
    ----> 1 df[:,2]

IndexError: index 2 is out of bounds for axis 1 with size 1

我是编码和使用python 2 jupyter笔记本的新手。任何形式的帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

要加载数据框,请使用

df = pd.read_csv(url, delim_whitespace=True, header=0)

您的数据似乎不是简单的标签分隔。所有内容最初都被转储到一个列中,因为pandas无法正确解析数据。

此外,要访问第3列,您应使用df.iloc[:, 2]