用于多个字段的自定义Ruby CSV转换器

时间:2013-10-09 05:33:53

标签: ruby csv fastercsv

我正在导入一个CSV文件,其中包含需要转换的字段,如下所示:

  • “True”(字符串) - > true(布尔值)
  • “False”(字符串) - > false(布尔值)
  • “%m /%d /%Y”(字符串格式) - >日期对象
  • “%m /%d /%Y%I:%M:%S%p”(字符串格式) - > DateTime对象

默认的CSV转换器与Date和DateTime字段不匹配。下面的方法似乎有效,但是想知道是否有更好的方法,可能是通过覆盖转换器使用的匹配模式?

 require 'csv'
 require 'date'

 src = <<csv
 active,date_created,date_modified
 "True","03/12/2012","03/12/2012 2:14:23 PM"
 "False","01/25/2011","03/12/2013 3:14:27 AM"
 csv

 CSV::Converters[:my_converters] = lambda{|field| 
   begin 
     case field.to_s
       when "True"
         true
       when "False"
         false
       when /^\d{2}\/\d{2}\/\d{4}$/
         Date.strptime(field,"%m/%d/%Y")
       else
         DateTime.strptime(field,"%m/%d/%Y %I:%M:%S %p")
       end
   rescue ArgumentError
     field
   end
 }

 csv = CSV(src, :headers => true, :converters => [:my_converters])
 csv.each{|row| puts row}

为真,2012-03-12,2012-03-12T14:14:23 + 00:00

假,2011-01-25,2013-03-12T03:14:27 + 00:00

2 个答案:

答案 0 :(得分:3)

如果默认转换器不足,这是正确的做法。我唯一的建议是将转换器分成不同的lambdas,因为CSV库已经设计为针对转换器阵列测试每个字段(使case多余)。

但如果这只是一个快速的一次性剧本,你所拥有的就足够了。

答案 1 :(得分:2)

相应地转换字段的名称(标题的名称)

custom_converter = lambda { |value, field_info|
  case field_info.header
  when 'OrderUuid', 'Exchange', 'Type', 'OrderType'
    value.to_s
  when 'Quantity', 'Limit', 'CommissionPaid', 'Price'
    value.to_f
  when 'Opened', 'Closed'
    Time.zone.parse(value)
  else
    fail("Unknown field name #{field_info.inspect}=#{value}")
  end
}

CSV.parse(content, headers: :first_row, converters: [custom_converter]).map(&:to_h)