我有2.3 GB csv
个文件。当我使用R的data.table库中的fread
函数读取它时,它会添加一个' 
'符号到第一列。
因此,我的数据的第一栏是' HistoryID
'在通过fread
阅读后,它变为' HistoryID
'。其他列不受影响。
是否应该使用特定的编码来解决此问题?
当我在read.csv
函数中读取数据时,如果我们使用' UTF-8-BOM'编码,但同样似乎不适用于fread
。
答案 0 :(得分:0)
根据关于头颅的文件 - R-data.html#Variations-on-read_002etable
字节顺序标记仍会导致编码问题,可以像这样处理:
it can be read on Windows by
read.table("intro.dat", fileEncoding = "UTF-8")
but on a Unix-alike might need
read.table("intro.dat", fileEncoding = "UTF-8-BOM")
查看2.1 Variations on read.table
似乎也建议read.csv使用这个技巧。