如何在许多文件中更改编码?

时间:2012-02-16 11:33:57

标签: linux bash

我试试这个:

find . -exec iconv -f iso8859-2 -t utf-8 {} \;

但输出转到屏幕,而不是同一个文件。怎么做?

4 个答案:

答案 0 :(得分:12)

试试这个:

find . -type f -print -exec iconv -f iso8859-2 -t utf-8 -o {}.converted {} \; -exec mv {}.converted {} \;

它将使用带有'.converted'后缀(扩展名)的临时文件,然后将其移动到原始名称,因此如果你的文件带有'.converted'后缀(我认为你没有),请小心。< / p>

此脚本对于包含空格的文件名也不安全,因此为了更加安全,您应该引用:“{}”而不是{}和“{} .converted”而不是{} .converted

答案 1 :(得分:1)

阅读enconv
如果您需要转换为当前的终端编码,您可以这样做:

find . -exec enconv -L czech {}\;

或者你想要的是什么:

find . -exec enconv -L czech -x utf8 {}\;

答案 2 :(得分:1)

我发现这种方法对我来说效果很好,特别是在我有多个文件编码和多个文件扩展名的情况下。

创建一个名为script.vim的vim脚本:

set bomb
set fileencoding=utf-8
wq

然后在您要定位的文件扩展名上运行脚本:

find . -type f \( -iname "*.html" -o -iname "*.htm" -o -iname "*.php" -o -iname "*.css" -o -iname "*.less" -o -iname "*.js" \) -exec vim -S script.vim {} \;

答案 3 :(得分:1)

没有人提出自动检测编码和重新编码的方法。

以下是从GIT的主分支重新编码为UTF-8所有HTM / HTML文件的示例。

git ls-tree master -r --name-only | grep htm | xargs -n1 -I{} bash -c 'recode "$(file -b --mime-encoding {})..utf-8" {}'