我正在导入一个CSV文件,其中包含需要转换的字段,如下所示:
默认的CSV转换器与Date和DateTime字段不匹配。下面的方法似乎有效,但是想知道是否有更好的方法,可能是通过覆盖转换器使用的匹配模式?
require 'csv'
require 'date'
src = <<csv
active,date_created,date_modified
"True","03/12/2012","03/12/2012 2:14:23 PM"
"False","01/25/2011","03/12/2013 3:14:27 AM"
csv
CSV::Converters[:my_converters] = lambda{|field|
begin
case field.to_s
when "True"
true
when "False"
false
when /^\d{2}\/\d{2}\/\d{4}$/
Date.strptime(field,"%m/%d/%Y")
else
DateTime.strptime(field,"%m/%d/%Y %I:%M:%S %p")
end
rescue ArgumentError
field
end
}
csv = CSV(src, :headers => true, :converters => [:my_converters])
csv.each{|row| puts row}
为真,2012-03-12,2012-03-12T14:14:23 + 00:00
假,2011-01-25,2013-03-12T03:14:27 + 00:00
答案 0 :(得分:3)
如果默认转换器不足,这是正确的做法。我唯一的建议是将转换器分成不同的lambdas,因为CSV库已经设计为针对转换器阵列测试每个字段(使case
多余)。
但如果这只是一个快速的一次性剧本,你所拥有的就足够了。
答案 1 :(得分:2)
相应地转换字段的名称(标题的名称)
custom_converter = lambda { |value, field_info|
case field_info.header
when 'OrderUuid', 'Exchange', 'Type', 'OrderType'
value.to_s
when 'Quantity', 'Limit', 'CommissionPaid', 'Price'
value.to_f
when 'Opened', 'Closed'
Time.zone.parse(value)
else
fail("Unknown field name #{field_info.inspect}=#{value}")
end
}
CSV.parse(content, headers: :first_row, converters: [custom_converter]).map(&:to_h)