无法将数据表从URL读入Python

时间:2015-07-28 20:55:34

标签: python

我对Python比较陌生,我在阅读数据集时遇到问题并以我需要的形式获取它。该数据集是从NOAA站点获得的海面温度的ASCII文件,格式为

YR MON NINO1+2 ANOM NINO3 ANOM NINO4 ANOM NINO34 ANOM
1982 1 24.29 -0.17 25.87 0.24 28.30 0.0026.72 0.15

我需要从存储在NOAA网站上的文件中读取数据,然后将表拆分为单独的列。以下代码似乎正确地在表中读取,但我似乎无法将列分开;变量似乎是空的。

import urllib2
response = urllib2.urlopen('http://www.cpc.ncep.noaa.gov/data/indices/sstoi.indices')
sst_data = response.read()

import StringIO
sst_data = StringIO.StringIO(sst_data)

import csv
r = csv.DictReader(sst_data)

for row in r:
    print row

year = []
month = []
for row in r:
    year.append(row['YR'])
    month.append(row['MON'])

print year

1 个答案:

答案 0 :(得分:0)

如果你的CSV数据实际上没有用逗号分隔,你需要告诉读者分割的内容如下:

dig <- mpfr("625075741017804806")
print(dig, 18)
# 1 'mpfr' number of precision  60   bits 
# [1] 6.25075741017804806e17

您的数据似乎也被不同数量的空格分隔。 skipinitialspace跳过了前置空间。