压缩它们时为什么二进制文件损坏了?

时间:2012-05-12 13:43:40

标签: ruby windows heroku zip binary-data

我有一项通过网络提供压缩文件的服务。该zip包含Windows平台的可执行文件。

我正在使用RubyZip库来压缩文件,但该过程会破坏二进制文件。在我的本地服务器上,我们通过系统调用使用zip命令,它工作正常。

Heroku没有zip命令,我只是选择了。

我正在使用这个课程:

require 'zip/zip'

# This is a simple example which uses rubyzip to
# recursively generate a zip file from the contents of
# a specified directory. The directory itself is not
# included in the archive, rather just its contents.
#
# Usage:
#   directoryToZip = "/tmp/input"
#   outputFile = "/tmp/out.zip"   
#   zf = ZipFileGenerator.new(directoryToZip, outputFile)
#   zf.write()
class ZipFileGenerator

  # Initialize with the directory to zip and the location of the output archive.
  def initialize(inputDir, outputFile)
    @inputDir = inputDir
    @outputFile = outputFile
  end

  # Zip the input directory.
  def write()
    entries = Dir.entries(@inputDir); entries.delete("."); entries.delete("..") 
    io = Zip::ZipFile.open(@outputFile, Zip::ZipFile::CREATE); 

    writeEntries(entries, "", io)
    io.close();
  end

  # A helper method to make the recursion work.
  private
  def writeEntries(entries, path, io)

    entries.each { |e|
      zipFilePath = path == "" ? e : File.join(path, e)
      diskFilePath = File.join(@inputDir, zipFilePath)
      puts "Deflating " + diskFilePath
      if  File.directory?(diskFilePath)
        io.mkdir(zipFilePath)
        subdir =Dir.entries(diskFilePath); subdir.delete("."); subdir.delete("..") 
        writeEntries(subdir, zipFilePath, io)
      else
        io.get_output_stream(zipFilePath) { |f| f.puts(File.open(diskFilePath, "rb").read())}
      end
    }
  end

end

2 个答案:

答案 0 :(得分:3)

如果是Windows,则可能必须以二进制模式打开输出文件。

例如:io = File.open('foo.zip','wb')

答案 1 :(得分:3)

theglauber's answer是正确的。正如the documentation of the IO class中所述,File的超类:

  

二进制文件模式。 抑制EOL< - > Windows上的CRLF转换。   除非明确指定,否则将外部编码设置为ASCII-8BIT。

强调我的。在Windows上,当在文本模式下打开文件时,本机行结尾(\r\n)会隐式转换为换行符(\n),这可能是导致损坏的原因。

还有一个事实是IO#puts确保输出以行分隔符(Windows上为\r\n)结束,这对于二进制文件格式是不可取的。

您也没有关闭File.open返回的文件。这是一个优雅的解决方案,将解决所有这些问题:

io.get_output_stream(zip_file_path) do |out|
  out.write File.binread(disk_file_path)
end