Ruby CSV用于分隔具有unicode字符的列

时间:2013-10-08 18:00:57

标签: ruby csv

我有一个由刺字符分隔的CSV文件。我能做到:

CSV.foreach(file_path, { encoding:'ISO8859-1', :col_sep => "þ" }) do |row|

但我希望通过解析我的文件并使用unicode版本的th来分隔列来安全。

我认为我在通话中尝试了不同的选项,例如:

CSV.foreach(file_path, { encoding:'unicode', :col_sep => "U+00DE" }) do |row|

但我无法弄清楚......

我应该如何在Ruby中执行此操作?

由于

1 个答案:

答案 0 :(得分:1)

这有效:

CSV.foreach(file_path, { encoding:'ISO-8859-1', :col_sep => "\u00FE" }) do |row|

谢谢@phoet

解决了这个问题:

Encoding.name_list.each do |encoding|
  CSV.foreach(file_path, { encoding:encoding, :col_sep => "\u00FE" }) do |row|
    puts row.inspect
    break
  end
end