Fread函数更改大型csv文件中第一列的名称

时间:2016-11-18 05:47:28

标签: r csv

我有2.3 GB csv个文件。当我使用R的data.table库中的fread函数读取它时,它会添加一个' '符号到第一列。

因此,我的数据的第一栏是' HistoryID'在通过fread阅读后,它变为' HistoryID'。其他列不受影响。 是否应该使用特定的编码来解决此问题?

当我在read.csv函数中读取数据时,如果我们使用' UTF-8-BOM'编码,但同样似乎不适用于fread

1 个答案:

答案 0 :(得分:0)

根据关于头颅的文件 - R-data.html#Variations-on-read_002etable

字节顺序标记仍会导致编码问题,可以像这样处理:

it can be read on Windows by
read.table("intro.dat", fileEncoding = "UTF-8")

but on a Unix-alike might need
read.table("intro.dat", fileEncoding = "UTF-8-BOM")

查看2.1 Variations on read.table

部分

似乎也建议read.csv使用这个技巧。