我无法使用weka加载csv文件,即使使用文本编辑器,我已经删除了每个特殊符号,但仍然没有运气。我附上文件,如果解决这个问题我将不得不承担。
它显示"错误的数值,读取31,预期27,读取令牌[EOL],第3行和#34;
link:https://drive.google.com/open?id=0By7zyIPDD6HJMmthWnZLSUk5aFE
答案 0 :(得分:0)
你的文件中有空字段,如果你将其下载为.csv,即使标题在其末尾有三个逗号。 例如你的第6行:
,Doug Walker ,,, 131,Rob Walker,131,纪录片,Doug Walker,星球大战:第七集The Force Awakens,8,143 ,, 0 ,,,,,,,,, 12,7.1 ,, 0 ,,,
Simmilar对这篇文章的建议你可以试试s.th.像记事本++或其他文本编辑器用“,?”替换“,,”来填补你的空白。
Convert NA values to ? automatically while loading
我做了这个,然后你在第一行得到两个问号,因为列名显然不起作用,所以改变第一行看起来像这样:
颜色,director_name,num_critic_for_reviews,持续时间,director_facebook_likes,actor_3_facebook_likes,actor_2_name,actor_1_facebook_likes,毛,流派,ACTOR_1_NAME,MOVIE_TITLE,num_voted_users,cast_total_facebook_likes,actor_3_name,facenumber_in_poster,plot_keywords,?,num_user_for_reviews,语言,国家,CONTENT_RATING,预算,TITLE_YEAR ,actor_2_facebook_likes,imdb_score,ASPECT_RATIO,movie_facebook_likes,的 additionalColName1,additionalColName2,additionalColName3 强>
如果您现在尝试导入数据,weka会开始告诉您哪些行不喜欢以及为什么。顺便说一句。你没有“删除每一个特殊符号”! 用例如删除fiew线后它起作用的character角色。
这只是一个丑陋的解决方法,尝试填充空值并找到正则表达式或更好的方法来保存文件以删除每行的最后三个逗号,我现在太懒了。但我可以加载到weka中,这就是你想要的(: