Ruby:如何自动添加“#encoding:UTF-8”?

时间:2011-01-26 12:48:26

标签: ruby encoding utf-8

是否有任何gem会自动为每个Ruby文件添加# encoding: UTF-8

或者有没有其他方法可以防止整个Ruby on Rails项目中出现invalid multibyte char (US-ASCII)错误(仅限于单个类)?

6 个答案:

答案 0 :(得分:27)

升级到Ruby 2.0,因为它使UTF-8成为默认编码,无需魔法评论。

答案 1 :(得分:24)

尝试使用magic_encoding gem,它可以将utf-8魔法注释插入应用中的所有ruby文件。

[编辑] 现在切换到Sublime Text我使用auto-encoding-for-ruby插件。

答案 2 :(得分:6)

的Vim:

:args **/*.ruby
:set hidden
:argdo norm! O# encoding: UTF-8
:wqa

答案 3 :(得分:2)

如果您正在使用Sublime Text 2,则可以使用在需要时自动包含编码声明的插件:https://github.com/elomarns/auto-encoding-for-ruby

答案 4 :(得分:2)

如何只运行脚本?

#!/usr/bin/env ruby1.9.1
require 'find'

fixfile = []

Find.find('.') do |path|
  next unless /\.rb$/.match(path);
  File.open(path) do |file|
    count = 0;
    type = :lib
    file.each do |line|
      if count == 0 and /#!/.match(line)
        type = :script
      end
      if  /utf/.match(line)
        break
      end
      if (count += 1) > 10 then
        fixfile.push path:path, type:type
        break
      end
    end
    if file.eof?
        fixfile.push path:path, type:type
    end
  end
end

fixfile.each do |info|
  path = info[:path]
  backuppath = path + '~'
  type = info[:type]
  begin
     File.delete(backuppath) if File.exist?(backuppath)
     File.link(path, backuppath)
  rescue Errno::ENOENT => x
     puts "could not make backup file '#{backuppath}' for '#{ path }': #{$!}"
     raise
  end
  begin
    inputfile = File.open(backuppath, 'r')
    File.unlink(path)
    File.open(path, 'w') do |outputfile|
      if type == :script
        line = inputfile.readline
        outputfile.write line
      end
      outputfile.write "# encoding: utf-8\n"
      inputfile.each do |line|
        outputfile.write line
      end
      inputfile.close
      outputfile.close
    end
  rescue => x
    puts "error: #{x} #{$!}"
    exit
  end

要使其自动添加到您的Rakefile。

如果您只想更新包含utf-8字符的文件,则可以运行file -bi #{path}并查找 charset = utf-8

答案 5 :(得分:0)

当您的文件真正存储在UTF-8中时,自动添加# encoding: UTF-8只会有意义。

如果您的文件是CP850(Windows中的默认AFAIK)编码而您使用非ASCII字符,则将invalid multibyte char (US-ASCII)替换为invalid multibyte char (UTF-8)

如果它真的是UTF-8,我宁愿手动修改和检查每个文件。