我想直接从网站加载数据集到jypyter笔记本,但每次我尝试使用python pandas' read_csv'上传数据集时,都会导入数据集,但我无法从中选择任何列数据集。
这是我的代码:
url = "http://ww2.amstat.org/publications/jse/datasets/fishcatch.dat.txt"
df = pd.read_csv(url, sep= '\t', header= 0)
print df
1 1 242.0 23.2 25.4 30.0 38.4 13.4 NA
0 2 1 290.0 24.0 26.3 31....
1 3 1 340.0 23.9 26.5 31....
2 4 1 363.0 26.3 29.0 33....
3 5 1 430.0 26.5 29.0 34....
这是我尝试访问数据集中的第3列时获得的错误
df[:,2]
IndexErrorTraceback (most recent call last)
<ipython-input-27-910d22bca5b5> in <module>()
----> 1 df[:,2]
IndexError: index 2 is out of bounds for axis 1 with size 1
我是编码和使用python 2 jupyter笔记本的新手。任何形式的帮助将不胜感激。
答案 0 :(得分:0)
要加载数据框,请使用
df = pd.read_csv(url, delim_whitespace=True, header=0)
您的数据似乎不是简单的标签分隔。所有内容最初都被转储到一个列中,因为pandas无法正确解析数据。
此外,要访问第3列,您应使用df.iloc[:, 2]
。