我正在尝试自学R(刚刚开始)。 我决定导入2个csv文件以对它们进行连接。
导入一个文件就可以了,另一个正在释放以下错误:
这是csv文件链接:
https://data.world/jonathankkizer/occupation-computerization
我使用了以下语句
occupationforjoin<-read.table("C:/Users/Admin/Desktop/-=Data
Science=-/11-27-2018/jonathankkizer-occupation-computerization/OccComp.csv",
header=TRUE, sep=",")
警告消息: 1:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中, :第1行似乎包含嵌入的null 2:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中, :第2行似乎包含嵌入的null 3:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中, :第3行似乎包含嵌入的null 4:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中, :第4行似乎包含嵌入的null 5:在read.table(“ C:/ Users / Admin / Desktop /-= Data Science =-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv”中, :第5行似乎包含嵌入的null 6:在scan(file = file,what = what,sep = sep,quote = quote,dec = dec,:引号字符串内的EOF 7:在scan(file = file,what = what,sep = sep,quote = quote,dec = dec,:在输入中找到嵌入的nul(s)
我在StackOverflow上发现这可能是由于编码所致,所以我使用了建议的解决方案并执行了该语句
occupationforjoin<-read.table("C:/Users/Admin/Desktop/-=Data
Science=-/11-27-2018/jonathankkizer-occupation-computerization/OccComp.csv",
header=TRUE, sep=",", fileEncoding="UTF-16LE")
它给了我不同的错误信息:
read.table(“ C:/ Users / Admin / Desktop /-= Data 科学=-/ 11-27-2018 / jonathankkizer-occupation-computerization / OccComp.csv“, : 列多于列名
我也尝试使用read.csv函数无济于事。
如何解决此问题并成功导入数据集?我在网上找到的所有解决方案(例如,使用“ skipNul = TRUE”,“ comment.char =“”参数)都没有帮助。
UPD: 如果您不想从数据世界下载csv文件,请粘贴以下数据集: https://pastebin.com/SPEtWT6f
答案 0 :(得分:1)
尝试使用 readr 包中的 read_csv()功能。
答案 1 :(得分:1)
使用dataframe = read.csv(“ name_of_file.csv”)
或
dataframe = read.csv(file.choose())。
希望这会起作用。
答案 2 :(得分:0)
我终于找到了解决方案! 我疯了;甚至我的教练也不知道该如何解决!
此语句有效:
o<-read.csv("C:/Users/Admin/Desktop/-=Data Science=-/11-27-2018/Occ.txt", header=T, sep="\t", fileEncoding="UTF-16LE")
就像我在最初的问题中说的那样:我尝试使用 fileEncoding =“ UTF-16LE” ,但没有帮助。问完问题后,我尝试使用 sep =“ \ t” ,但没有帮助。但是同时使用两者中的都可以做到这一点!