如何在R中加载csv时删除特殊字符?

时间:2015-07-10 01:43:51

标签: r csv quotes read.csv

我有类似的问题:read.csv warning 'EOF within quoted string' prevents complete reading of file

也就是说,当我加载csv R时说:

Warning message:
In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  :
EOF within quoted string

我可以通过申请来解决这个错误:quotes ="" to read.csv

但主要问题仍然存在,只有22111行689233被读入R.我想尝试从csv中删除所有特殊字符,看看是否能解决问题。

相关我发现了这个:How to remove specific special characters in R

但是有没有办法在read.csv中做到这一点,那就是我在文件中阅读的阶段?

3 个答案:

答案 0 :(得分:1)

您是否从fread尝试data.table了?它可以优化任务并可能处理一些常见问题。由于您没有提供任何数据,我给出了一个愚蠢的例子:

> fread('col1,col2\n5,"4\n3"')
   col1 col2
1:    5 4\n3

答案 1 :(得分:0)

这确实是一个特殊的角色。第22,112行有一个→(箭头,十六进制值0x1A)。 删除箭头后,我得到正常加载的数据!

答案 2 :(得分:0)

具有特殊字符的数据表expord csv的解决方案 从中找到字符集  https://cdn.datatables.net/buttons/1.1.2/js/buttons.html5.js 要么  https://cdn.datatables.net/buttons/1.1.2/js/buttons.html5.min.js

并将其从'UTF-8'

更改为'UTF-8-BOM'