我创建了一个脚本(.sh文件),用于将CSV文件从ANSI编码转换为UTF-8。 我使用的命令是:
iconv -f "windows-1252" -t "UTF-8" $csvname -o $newcsvname
我从另一个Stack Overflow帖子中得到了这个。
但是iconv
命令似乎不起作用。
Notepad ++中输入文件内容的快照
下面第二个csv文件的快照,
编辑:我尝试将有问题的输入CSV文件内容减少到几行(类似于第一个文件),现在它被转换得很好。那么文件内容本身有问题吗?我该如何检查?
答案 0 :(得分:0)
您可以使用python chardet字符编码检测器来确保现有的字符编码格式。
iconv -f {字符编码} -t utf-8 {FileName}> {输出文件名}
这应该有效。还要检查文件中是否存在任何垃圾字符,这可能会在转换时产生错误。