更快的方法来提取大文件中的年份

时间:2016-09-28 21:53:54

标签: r data.table

我正在处理一个5GB的文件(19M行和16列)。此文件中的一个字段是YearQtr格式。例2014Q1。我按照Extract year from date帖子提取年份信息:

library(zoo)
x <- "2014Q1"
d <- as.factor(format(as.yearqtr(x), "%Y"))

虽然这有效,但因为我有大约19M行,所以RStudio需要永远处理它。例如,fread读取文件大约需要45秒,而提取年份需要10分钟!无论如何我能让这项工作更快吗?我很欣赏任何想法。我甚至试过as.Date(),但没有任何进步。有什么想法吗?

0 个答案:

没有答案