我正在尝试使用R中的数据表(library(data.table)
)读取非常大的数据集
数据集使用问号?
编码缺失值。我试图读取数据,同时将一列转换为日期格式。我怀疑我的代码会起作用,但是fread
正在将所有列转换为字符类,因为它无法将?
作为na.strings()
选项处理。
我可以通过read.csv解决这个问题,但这样做太慢了。有人知道如何解决这个问题吗?
这是我的代码:
setClass("date")
setAs("character","date", function(from) as.Date(from, format="%d/%m/%Y") )
DT<- fread("data.txt", na.strings="?", colClasses = c("date", "character", rep("numeric", 7)))