我试图用R来分析https://www.kaggle.com/datasnaek/youtube-new/数据集。 csv文件在Excel中打开正常,但无法使用
正确加载到R中data <- read.csv(
"USvideos.csv",
header=TRUE,
sep = ",",
row.names = NULL,
quote = "\"")
事实证明,列中的引号中有"
个字符,并且列中的引号中也有新的行字符。
有没有办法让R弄清楚第一个和最后一个"
字符是唯一的引号字符,并忽略csv文件中的所有“字符和换行符,就像Excel那样?” p>
非常感谢!
答案 0 :(得分:0)
我written a quick kernel to double check the data。它用基数R读取很好,但是当你尝试将它作为一个元素读取时会发出一些警告。不过,它似乎仍然或多或少地加载。
作为一个注释,你的一些read.csv()参数只是该参数的默认值(如quote),所以我只是省略了它们。最底层的例子使用了你的确切语法并且工作正常,所以我不确定你遇到麻烦的地方。