我有一个大型数据框,在R中有3200万行。我想使用自定义时间戳持续时间对其进行过滤。但对于这个大型数据集,R Studio每次尝试将其转换为XTS对象以过滤数据时都会崩溃。
XTSDATA <- xts(dataset[, -1], dataset[, 1])
Data_filt <- XTSDATA["T09:30:00/T15:30:00"]
Data_df <- data.frame(date=index(Data_filt), coredata(Data_filt))
任何人都可以建议。以下是我的数据样本。
times value size stockName
2/1/2016 9:15:01 91.8 500 TV IS Equity
2/1/2016 9:15:02 92.4 1420 TV IS Equity
2/1/2016 9:15:04 92.2 5000 TV IS Equity
2/1/2016 9:15:05 91.9 6524 TV IS Equity
2/1/2016 9:15:06 91.9 11524 TV IS Equity
2/1/2016 9:15:06 92.05 6824 TV IS Equity
2/1/2016 9:15:08 92 1824 TV IS Equity
2/1/2016 9:15:08 92.05 4972 TV IS Equity
2/1/2016 9:15:13 92.2 6704 TV IS Equity
2/1/2016 9:15:14 92 1 TV IS Equity
感谢。
ADDL。信息:数据位于RData文件中,该文件使用API包直接从Bloomberg下载。所以对于这种大型数据集,我没有使用excel。此外,我计划在嵌套for循环中为每个安全性和每个交易日划分数据,然后从那里过滤时间戳间隔。但这确实是一个漫长的过程。所以我希望是否有人可以在同一个实例中为整个数据集建议任何流程。