在R中导入数据时避免冲突

时间:2017-03-20 20:14:43

标签: r rstudio h2o import-from-csv sklearn-pandas

我在尝试将CS​​V导入到具有多个重复列的R中时遇到错误,有没有办法可以忽略这些列? 如果是小文件和少量列,这很容易做到,但我的是一个大的~3k列和10M行。

2 个答案:

答案 0 :(得分:2)

或者,将check.names arg设置为FALSE。

答案 1 :(得分:1)

在第一行阅读,即I。列标题,带有readLines。 strsplit解析为vector。重命名重复的元素。然后你可以用col.names arg。

调用read.csv