在R中导入csv的问题

时间:2018-11-28 01:10:39

标签: r csv dataset read.table

我正在尝试自学R(刚刚开始)。 我决定导入2个csv文件以对它们进行连接。

导入一个文件就可以了,另一个正在释放以下错误:

这是csv文件链接:

  

https://data.world/jonathankkizer/occupation-computerization

我使用了以下语句

occupationforjoin<-read.table("C:/Users/Admin/Desktop/-=Data
Science=-/11-27-2018/jonathankkizer-occupation-computerization/OccComp.csv",
header=TRUE, sep=",")
  

警告消息:       1:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中,   :第1行似乎包含嵌入的null       2:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中,   :第2行似乎包含嵌入的null       3:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中,   :第3行似乎包含嵌入的null       4:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中,   :第4行似乎包含嵌入的null       5:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中,   :第5行似乎包含嵌入的null       6:在scan(file = file,what = what,sep = sep,quote = quote,dec = dec,:引号字符串内的EOF       7:在scan(file = file,what = what,sep = sep,quote = quote,dec = dec,:在输入中找到嵌入的nul(s)

我在StackOverflow上发现这可能是由于编码所致,所以我使用了建议的解决方案并执行了该语句

occupationforjoin<-read.table("C:/Users/Admin/Desktop/-=Data
Science=-/11-27-2018/jonathankkizer-occupation-computerization/OccComp.csv",
header=TRUE, sep=",", fileEncoding="UTF-16LE")

它给了我不同的错误信息:

  

read.table(“ C:/ Users / Admin / Desktop /-= Data   科学=-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv“,   :         列多于列名

我也尝试使用read.csv函数无济于事。

如何解决此问题并成功导入数据集?我在网上找到的所有解决方案(例如,使用“ skipNul = TRUE”,“ comment.char =“”参数)都没有帮助。

UPD: 如果您不想从数据世界下载csv文件,请粘贴以下数据集: https://pastebin.com/SPEtWT6f

3 个答案:

答案 0 :(得分:1)

尝试使用 readr 包中的 read_csv()功能。

答案 1 :(得分:1)

使用dataframe = read.csv(“ name_of_file.csv”)

dataframe = read.csv(file.choose())。

希望这会起作用。

答案 2 :(得分:0)

我终于找到了解决方案! 我疯了;甚至我的教练也不知道该如何解决!

此语句有效:

o<-read.csv("C:/Users/Admin/Desktop/-=Data Science=-/11-27-2018/Occ.txt", header=T, sep="\t", fileEncoding="UTF-16LE")

就像我在最初的问题中说的那样:我尝试使用 fileEncoding =“ UTF-16LE” ,但没有帮助。问完问题后,我尝试使用 sep =“ \ t” ,但没有帮助。但是同时使用两者中的都可以做到这一点!