熊猫雅虎股票API

时间:2017-03-22 04:19:48

标签: python pandas yahoo-api yahoo-finance

我是Pandas(和Python)的新手,并尝试使用Yahoo API来获取股票价格。

我需要获取数据,循环遍历并获取日期和值。

这是代码

df = pd.get_data_yahoo( symbols = 'AAPL',
     start = datetime( 2011, 1, 1 ),
     end = datetime( 2012, 1, 1 ),
     interval = 'm' )

结果是:

df
            Open        High         Low       Close     Volume
Date                                                                    
2011-01-03  325.640015  348.600006  324.840027  339.320007  140234700   
2011-02-01  341.299988  364.899994  337.720001  353.210022  127618700   
2011-03-01  355.470001  361.669983  326.259979  348.510010  125874700   

我可以获取日期而不是月份日期值,因为它是索引(?)

如何最好地循环访问此信息的数据?这是关于处理数据而不是排序或搜索数据。

4 个答案:

答案 0 :(得分:1)

如果您需要迭代数据框中的行并进行一些处理,那么pandas.DataFrame.apply()效果很好。

<强>代码:

一些模拟处理代码......

def process_data(row):
    # the index becomes the name when converted to a series (row)
    print(row.name.month, row.Close)

测试代码:

import datetime as dt
from pandas_datareader import data

df = data.get_data_yahoo(
    'AAPL',
    start=dt.datetime(2011, 1, 1),
    end=dt.datetime(2011, 5, 1),
    interval='m')
print(df)

# process each row
df.apply(process_data, axis=1)

<强>结果:

                  Open        High         Low       Close     Volume  \
Date                                                                    
2011-01-03  325.640015  348.600006  324.840027  339.320007  140234700   
2011-02-01  341.299988  364.899994  337.720001  353.210022  127618700   
2011-03-01  355.470001  361.669983  326.259979  348.510010  125874700   
2011-04-01  351.110016  355.130005  320.160004  350.130005  128252100   

            Adj Close  
Date                   
2011-01-03  43.962147  
2011-02-01  45.761730  
2011-03-01  45.152802  
2011-04-01  45.362682  

1 339.320007
2 353.210022
3 348.51001
4 350.130005

答案 1 :(得分:0)

这是在尝试使用雅虎数据时让我的生活变得古怪的原因。 首先是从数据框索引中获取日期。

df = df.assign( date = df.index.date )

这里有一些我发现从处理数据有帮助的其他人。

df [ 'diff' ] = df [ 'Close' ].diff( )
df [ 'pct_chg' ] = df [ 'Close' ].pct_change()
df [ 'hl' ] = df [ 'High' ] - df [ 'Low' ]

熊猫是惊人的东西。

答案 2 :(得分:0)

我相信这对你有用。

import pandas_datareader.data as web
import datetime    

start = datetime.datetime(2013, 1, 1)
end = datetime.datetime(2016, 1, 27)
df = web.DataReader("GOOGL", 'yahoo', start, end)

dates =[]
for x in range(len(df)):
    newdate = str(df.index[x])
    newdate = newdate[0:10]
    dates.append(newdate)

df['dates'] = dates

print df.head()
print df.tail()

另外,请查看下面的链接,了解有关如何执行此类操作的更多有用提示。

https://pandas-datareader.readthedocs.io/en/latest/remote_data.html#yahoo-finance

答案 3 :(得分:0)

from pandas_datareader import data as pdr
from datetime import date
import yfinance as yf
yf.pdr_override() 
import pandas as pd
import requests
import json
from os import listdir
from os.path import isfile, join


# Tickers List
tickers_list = ['AAPL', 'GOOGL','FB', 'WB' , 'MO']

today = date.today()

# We can get data by our choice by giving days bracket
start_date= "2010-01-01"


files=[]
def getData(ticker):
    print (ticker)
    data = pdr.get_data_yahoo(ticker, start=start_date, end=today)
    dataname= ticker+'_'+str(today)
    files.append(dataname)
    SaveData(data, dataname)

# Create an data folder to save these data file in data folder.
def SaveData(df, filename):
    df.to_csv('./data/'+filename+'.csv')


for tik in tickers_list:
    getData(tik)