使用tohash.select时如何用字符串替换空值?

时间:2019-03-28 19:30:09

标签: ruby-on-rails ruby

如果不清楚,请原谅我,但这很难用语言来描述。我正在使用Ruby for Rails应用程序从CSV文件逐行接收值,使用Ruby的tohash.select函数为每一行生成所有键值对的哈希表,然后使用create函数生成行表。

该代码可用于从CSV创建数据库表,但是CSV内的许多记录的某些字段/列具有空值。在将CSV中的每一行插入哈希表时,我希望将这些null值转换为类似“ null”的字符串。

我尝试使用正则表达式用字符串替换空值,但是它没有用。我很可能只是做错了。

require 'csv'

fields = %w{lVoterUniqueID sAffNumber szStateVoterID sVoterTitle szNameLast szNameFirst szNameMiddle sNameSuffix sGender szSitusAddress szSitusCity sSitusState sSitusZip sHouseNum sUnitAbbr sUnitNum szStreetName sStreetSuffix sPreDir sPostDir szMailAddress1 szMailAddress2 szMailAddress3 szMailAddress4 szMailZip szPhone szEmailAddress dtBirthDate sBirthPlace dtRegDate dtOrigRegDate dtLastUpdate_dt sStatusCode szStatusReasonDesc sUserCode1 sUserCode2 iDuplicateIDFlag szLanguageName szPartyName szAVStatusAbbr szAVStatusDesc szPrecinctName sPrecinctID sPrecinctPortion sDistrictID_0 iSubDistrict_0 szDistrictName_0 sDistrictID_1 iSubDistrict_1 szDistrictName_1 sDistrictID_2 iSubDistrict_2 szDistrictName_2 sDistrictID_3 iSubDistrict_3 szDistrictName_3 sDistrictID_4 iSubDistrict_4 szDistrictName_4 sDistrictID_5 iSubDistrict_5 szDistrictName_5}

if Rails.env.production?
  CSV.foreach(Dir.pwd + "/db/prod.csv", encoding: 'iso-8859-1:utf-8', headers: true) do |row|
    voter_row = row.to_hash.select { |k, v| fields.include?(k)}
    Voter.create!(voter_row.to_hash.symbolize_keys)
  end
elsif Rails.env.development?
  CSV.foreach(Dir.pwd + "/db/Cntywd_020819.csv", headers: true) do |row|
    voter_row = row.to_hash.select { |k, v| fields.include?(k)}
    Voter.create!(voter_row.to_hash.symbolize_keys)
  end
else
  CSV.foreach(Dir.pwd + "/db/Cntywd_020819.csv", headers: true) do |row|
  voter_row = row.to_hash.select { |k, v| fields.include?(k)}
  Voter.create!(voter_row.to_hash.symbolize_keys)
end
end

无论我使用row.tohash.select为何,我都想用一个空字符串替换空值,这样哈希表中的每个键都有一个对应的字符串(如果没有值,则为“ null”)。 / p>

3 个答案:

答案 0 :(得分:1)

有一种Hash#transform_values方法以一种干净整洁的方式完成工作。我也建议使用Hash#slice而不是#select

...
CSV.foreach(Dir.pwd + "/db/prod.csv", encoding: 'iso-8859-1:utf-8', headers: true) do |row|
  attrs = row.to_hash.slice(*fields).transform_values { |v| v || "null" }
  Voter.create!(attrs)
end
...

但是,老实说,实际上,我会提出另一种解决方案-如果可能,对数据库列使用默认值,而不是在应用程序级别“标准化”数据。

答案 1 :(得分:0)

您必须遍历值并在适当的地方进行设置。

if Rails.env.production?
  CSV.foreach(Dir.pwd + "/db/prod.csv", encoding: 'utf-8', headers: true) do |row|
    voter_row = row.to_hash.select { |k, v| fields.include?(k)}
    voter_row.each do |key, value|
      if value.nil?
        voter_row[key] = "null"
      end
    end
    Voter.create!(voter_row.to_hash.symbolize_keys)
  end
else
  CSV.foreach(Dir.pwd + "/db/Cntywd_020819.csv", headers: true) do |row|
  voter_row = row.to_hash.select { |k, v| fields.include?(k)}
  voter_row.each do |key, value|
    if value.nil?
      voter_row[key] = "null"
    end
  end
  Voter.create!(voter_row.to_hash.symbolize_keys)
end

我还认为您的elseif / else是多余的,除非我丢失了某些东西。

答案 2 :(得分:0)

这听起来像是Hash#transform_values的工作:

h = voter_row.transform_values { |v| v.nil?? 'null' : v }

加上其他东西:

  1. 您可能希望使用Hash#slice而不是#select

    voter_row = row.to_h.slice(*fields)
    
  2. create对字符串键很满意,因此您无需调用#symbolize_keys

您可以将CSV.foreach块简化为:

Voter.create!(row.to_h.slice(*fields))

您可以进一步写:

opts = { headers: true }
if Rails.env.production?
  csv_file = 'db/prod.csv'
  opts[:encoding] 'iso-8859-1:utf-8'
elsif Rails.env.development?
  csv_file = 'db/Cntywd_020819.csv'
else
  csv_file = 'db/Cntywd_020819.csv'
end
CSV.foreach(Rails.root.join(csv_file), opts) do |row|
  Voter.create!(row.to_h.slice(*fields))
end