使用Numpy创建雅虎财务价格表

时间:2011-08-08 00:07:42

标签: python url numpy

不使用matplotlib财务模块。我喜欢将url数据转换为numpy数组。 在哪里我可以列标题来做数学。喜欢:

prices = r.adj_close

自: http://matplotlib.sourceforge.net/examples/pylab_examples/finance_work2.html

除了我不想使用:

fh = finance.fetch_historical_yahoo(ticker, startdate, enddate)
# a numpy record array with fields: date, open, high, low, close, volume, adj_close)

r = mlab.csv2rec(fh); fh.close()
r.sort()

使用手动创建网址:

        url = http://ichart.yahoo.com/table.csv?a=2&c=2011&b=30&e=7&d=7&g=d&f=2011&s=msft&ignore=.csv

        f = urllib.urlopen(url)
        fr = f.read()



        hdata = np.asarray(fr, dtype='object')
        prices = hdata.adj_close
        print prices

3 个答案:

答案 0 :(得分:4)

使用numpy.loadtxt()加载csv:

import numpy as np
import pylab as pl
import urllib
url = "http://ichart.yahoo.com/table.csv?a=2&c=2011&b=30&e=7&d=7&g=d&f=2011&s=msft&ignore=.csv"
f = urllib.urlopen(url)
title = f.readline().strip().split(",")
data = np.loadtxt(f, dtype=np.float, delimiter=",", converters={0: pl.datestr2num}))

第一列是日期,因此请使用pylab.datestr2num将其转换为数字。

答案 1 :(得分:0)

如果您不想加载pylab进行时间字符串转换,可以将mktime函数用作lambda:

import numpy as np
import urllib
import time 
url = "http://ichart.yahoo.com/table.csv?a=2&c=2011&b=30&e=7&d=7&g=d&f=2011&s=msft&ignore=.csv" 
f = urllib.urlopen(url) 
title = f.readline().strip().split(",") 
data = np.loadtxt(f, dtype={'names': ('dtime', 'open', 'high','low','close','volume','aclose'),
                            'formats': ('u4', 'f8', 'f8','f8','f8','u4','f8')}, 
                     delimiter=",", 
                     converters={0: lambda y:int(time.mktime(time.strptime(y,'%Y-%m-%d')))})

答案 2 :(得分:0)

也可以使用S10告诉numpy第一个实体是长度为10的字符串。这样,你就不需要使用lambda。

data = np.loadtxt(f, dtype={'names': ('dtime', 'open', 'high','low','close','volume','aclose'), 'formats': ('S10', '<f8', '<f8','<f8','<f8','i','<f8')}, 
                             delimiter="," )

i=integer, <f8 =0.256, f8=0.25600001298, S10="MM-DD-YYYY"

有关f,f8,u4,S,u8等的更多信息,请访问此link