我正在处理一个5GB的文件(19M行和16列)。此文件中的一个字段是YearQtr格式。例2014Q1。我按照Extract year from date帖子提取年份信息:
library(zoo)
x <- "2014Q1"
d <- as.factor(format(as.yearqtr(x), "%Y"))
虽然这有效,但因为我有大约19M行,所以RStudio需要永远处理它。例如,fread
读取文件大约需要45秒,而提取年份需要10分钟!无论如何我能让这项工作更快吗?我很欣赏任何想法。我甚至试过as.Date()
,但没有任何进步。有什么想法吗?