按R中的大型数据帧中的时间戳过滤行

时间:2016-09-16 08:29:51

标签: r dataframe timestamp xts large-data

我有一个大型数据框,在R中有3200万行。我想使用自定义时间戳持续时间对其进行过滤。但对于这个大型数据集,R Studio每次尝试将其转换为XTS对象以过滤数据时都会崩溃。

XTSDATA <- xts(dataset[, -1], dataset[, 1])
Data_filt <- XTSDATA["T09:30:00/T15:30:00"]
Data_df <- data.frame(date=index(Data_filt), coredata(Data_filt))

任何人都可以建议。以下是我的数据样本。

    times           value   size    stockName
2/1/2016 9:15:01    91.8    500     TV IS Equity
2/1/2016 9:15:02    92.4    1420    TV IS Equity
2/1/2016 9:15:04    92.2    5000    TV IS Equity
2/1/2016 9:15:05    91.9    6524    TV IS Equity
2/1/2016 9:15:06    91.9    11524   TV IS Equity
2/1/2016 9:15:06    92.05   6824    TV IS Equity
2/1/2016 9:15:08    92      1824    TV IS Equity
2/1/2016 9:15:08    92.05   4972    TV IS Equity
2/1/2016 9:15:13    92.2    6704    TV IS Equity
2/1/2016 9:15:14    92      1       TV IS Equity

感谢。

ADDL。信息:数据位于RData文件中,该文件使用API​​包直接从Bloomberg下载。所以对于这种大型数据集,我没有使用excel。此外,我计划在嵌套for循环中为每个安全性和每个交易日划分数据,然后从那里过滤时间戳间隔。但这确实是一个漫长的过程。所以我希望是否有人可以在同一个实例中为整个数据集建议任何流程。

0 个答案:

没有答案