正确将Kaggle数据集导入R

时间:2018-03-20 06:18:28

标签: r quote kaggle read.csv

我试图用R来分析https://www.kaggle.com/datasnaek/youtube-new/数据集。 csv文件在Excel中打开正常,但无法使用

正确加载到R中
data <- read.csv(
    "USvideos.csv", 
    header=TRUE, 
    sep = ",", 
    row.names = NULL, 
    quote = "\"") 

事实证明,列中的引号中有"个字符,并且列中的引号中也有新的行字符。

有没有办法让R弄清楚第一个和最后一个"字符是唯一的引号字符,并忽略csv文件中的所有“字符和换行符,就像Excel那样?” p>

非常感谢!

1 个答案:

答案 0 :(得分:0)

written a quick kernel to double check the data。它用基数R读取很好,但是当你尝试将它作为一个元素读取时会发出一些警告。不过,它似乎仍然或多或少地加载。

作为一个注释,你的一些read.csv()参数只是该参数的默认值(如quote),所以我只是省略了它们。最底层的例子使用了你的确切语法并且工作正常,所以我不确定你遇到麻烦的地方。