高效读取包含刻度级fx数据并将其转换为OHLC数据的.csv文件

时间:2015-01-13 21:01:12

标签: python csv pandas

所以我从dukascopy.com下载了一些包含FX数据(tick-level)的.csv文件,我很想将它们转换成Pandas Series对象,然后又将它们重新采样到OHLC。我在下面写了以下函数(请参阅数据集提取):

def extract_tickalt(file):
raw = pandas.io.parsers.read_csv(file, index_col = 1, parse_dates=True)
ts = pd.Series(raw['Ask'])
return ts.resample('1min', how='ohlc')


# Data Sample 
Currency,timestamp,Bid,Ask
EUR/USD,20110102 21:50:01.700,1.33212,1.3374
EUR/USD,20110102 21:50:01.739,1.3345,1.3374
EUR/USD,20110102 21:50:01.901,1.33341,1.33611
EUR/USD,20110102 21:50:01.965,1.3345,1.33611
EUR/USD,20110102 21:50:56.741,1.3345,1.33502
...

该功能本身可行但不幸的是每个文件需要15分钟。我浏览了替代方案,我知道还有一些其他模块具有可以帮助这个过程的功能 - 但是我很想使用原生于熊猫的解决方案。

0 个答案:

没有答案