所以我从dukascopy.com下载了一些包含FX数据(tick-level)的.csv文件,我很想将它们转换成Pandas Series对象,然后又将它们重新采样到OHLC。我在下面写了以下函数(请参阅数据集提取):
def extract_tickalt(file):
raw = pandas.io.parsers.read_csv(file, index_col = 1, parse_dates=True)
ts = pd.Series(raw['Ask'])
return ts.resample('1min', how='ohlc')
# Data Sample
Currency,timestamp,Bid,Ask
EUR/USD,20110102 21:50:01.700,1.33212,1.3374
EUR/USD,20110102 21:50:01.739,1.3345,1.3374
EUR/USD,20110102 21:50:01.901,1.33341,1.33611
EUR/USD,20110102 21:50:01.965,1.3345,1.33611
EUR/USD,20110102 21:50:56.741,1.3345,1.33502
...
该功能本身可行但不幸的是每个文件需要15分钟。我浏览了替代方案,我知道还有一些其他模块具有可以帮助这个过程的功能 - 但是我很想使用原生于熊猫的解决方案。