识别有问题的数据行,导致批量导入错误

时间:2013-03-13 10:31:21

标签: ruby-on-rails ruby utf-8 activerecord-import

我正在使用activerecord-import将.csv文件中的一堆数据批量插入到我的rails应用程序中。不幸的是,当我在模型上调用import时出现错误。

ArgumentError (invalid byte sequence in UTF-8)

我知道问题是我在导入的1000多行数据中有一个奇怪字符的字符串,但我无法弄清楚哪一行是问题。

activerecord-import是否内置了任何错误处理,我可以用它来确定哪些行/行有问题(例如我在模型上调用导入函数时可以设置的一些选项)?据我所知,答案是否定的。

或者,我可以编写一些代码来检查我传入activerecord-import的数组,以确定哪些行的字符串在UTF-8中无效?

1 个答案:

答案 0 :(得分:0)

无法查看数据,只能猜测。最有可能的是,你有一个非UTF-8有效的字符组合。

您应该可以使用

检查文件
iconv -f utf8 <filename>