我想使用readr
包,因为我将来会处理一些更大的文件。我的问题是,有一个名为Intensity
的列有一些非常大的值(例如5493500000
)。我的问题是,第一次显示这个大值是在第2200行,readr
已经将列定义为integer
而不是numeric
,并产生缓冲区溢出。
有没有办法只为read_tsv
函数提供单一列类型,因为我不想为所有(大约)40列提供正确的类型。
感谢任何帮助。
答案 0 :(得分:3)
您需要参数col_types = cols(Intensity = col_double())
,根据手册,这将防止基于前1000行的列类型的插补。如果您只希望列的子集使用cols_only
。