我是Pandas(和Python)的新手,并尝试使用Yahoo API来获取股票价格。
我需要获取数据,循环遍历并获取日期和值。
这是代码
df = pd.get_data_yahoo( symbols = 'AAPL',
start = datetime( 2011, 1, 1 ),
end = datetime( 2012, 1, 1 ),
interval = 'm' )
结果是:
df
Open High Low Close Volume
Date
2011-01-03 325.640015 348.600006 324.840027 339.320007 140234700
2011-02-01 341.299988 364.899994 337.720001 353.210022 127618700
2011-03-01 355.470001 361.669983 326.259979 348.510010 125874700
我可以获取日期而不是月份日期值,因为它是索引(?)
如何最好地循环访问此信息的数据?这是关于处理数据而不是排序或搜索数据。
答案 0 :(得分:1)
如果您需要迭代数据框中的行并进行一些处理,那么pandas.DataFrame.apply()
效果很好。
<强>代码:强>
一些模拟处理代码......
def process_data(row):
# the index becomes the name when converted to a series (row)
print(row.name.month, row.Close)
测试代码:
import datetime as dt
from pandas_datareader import data
df = data.get_data_yahoo(
'AAPL',
start=dt.datetime(2011, 1, 1),
end=dt.datetime(2011, 5, 1),
interval='m')
print(df)
# process each row
df.apply(process_data, axis=1)
<强>结果:强>
Open High Low Close Volume \
Date
2011-01-03 325.640015 348.600006 324.840027 339.320007 140234700
2011-02-01 341.299988 364.899994 337.720001 353.210022 127618700
2011-03-01 355.470001 361.669983 326.259979 348.510010 125874700
2011-04-01 351.110016 355.130005 320.160004 350.130005 128252100
Adj Close
Date
2011-01-03 43.962147
2011-02-01 45.761730
2011-03-01 45.152802
2011-04-01 45.362682
1 339.320007
2 353.210022
3 348.51001
4 350.130005
答案 1 :(得分:0)
这是在尝试使用雅虎数据时让我的生活变得古怪的原因。 首先是从数据框索引中获取日期。
df = df.assign( date = df.index.date )
这里有一些我发现从处理数据有帮助的其他人。
df [ 'diff' ] = df [ 'Close' ].diff( )
df [ 'pct_chg' ] = df [ 'Close' ].pct_change()
df [ 'hl' ] = df [ 'High' ] - df [ 'Low' ]
熊猫是惊人的东西。
答案 2 :(得分:0)
我相信这对你有用。
import pandas_datareader.data as web
import datetime
start = datetime.datetime(2013, 1, 1)
end = datetime.datetime(2016, 1, 27)
df = web.DataReader("GOOGL", 'yahoo', start, end)
dates =[]
for x in range(len(df)):
newdate = str(df.index[x])
newdate = newdate[0:10]
dates.append(newdate)
df['dates'] = dates
print df.head()
print df.tail()
另外,请查看下面的链接,了解有关如何执行此类操作的更多有用提示。
https://pandas-datareader.readthedocs.io/en/latest/remote_data.html#yahoo-finance
答案 3 :(得分:0)
from pandas_datareader import data as pdr
from datetime import date
import yfinance as yf
yf.pdr_override()
import pandas as pd
import requests
import json
from os import listdir
from os.path import isfile, join
# Tickers List
tickers_list = ['AAPL', 'GOOGL','FB', 'WB' , 'MO']
today = date.today()
# We can get data by our choice by giving days bracket
start_date= "2010-01-01"
files=[]
def getData(ticker):
print (ticker)
data = pdr.get_data_yahoo(ticker, start=start_date, end=today)
dataname= ticker+'_'+str(today)
files.append(dataname)
SaveData(data, dataname)
# Create an data folder to save these data file in data folder.
def SaveData(df, filename):
df.to_csv('./data/'+filename+'.csv')
for tik in tickers_list:
getData(tik)