导轨控制台中的软标志

时间:2013-04-29 06:26:28

标签: ruby-on-rails console

我想通过控制台创建多个类别,我希望能够添加软标志。此刻我无法做到。

预测我可以使用软标志保存类别名称非常重要。

有人可以告诉我在哪里搜索吗?我搜索了这样的标签 - 软标志栏。 没有任何有用的资源。

由于

修改

我的母语中的软标志是这样的。

Š,Š,Ē,Ž用这个符号称为软符号来表示角色。


此刻,当我尝试保存新的类别记录时,它向我显示了这种错误 thodError: undefined method cache_ancestry!”为#

但我确信我没有更改模型或控制器中的任何内容:(

2 个答案:

答案 0 :(得分:2)

这是什么版本的Ruby?您所看到的是US-ASCII字符串,其中包含UTF-8数据(Ruby 1.9)或字节数组(Ruby 1.8)。

如果您使用的是Ruby 1.8,则可能需要使用Iconv将编码从US-ASCII转换为UTF-8。如果您使用的是Ruby 1.9,那么请确保您正在创建UTF-8字符串,它应该可以正常工作。

请注意,这些转义序列是正确的 - 这是这些字符的文字字节数组,假设应用了正确的编码,因此您可能不需要实际更改任何内容。如果字节是正确的,一切都很好 - 你只是看到ruby将字符串解释为ASCII而不是UTF-8或诸如此类的东西。

在Ruby 1.8中,当你#inspect一个字符串时,你会获得转义版本,但是puts它会显示实际的字符串:

1.8.7 :021 > s = "Komunālās mašīnas"
 => "Komun\304\201l\304\201s ma\305\241\304\253nas"
1.8.7 :022 > puts s
Komunālās mašīnas

在1.9中,只要你的编码是正确的,你就能得到正确的显示:

1.9.3p327 :001 > s = "Komunālās mašīnas"
 => "Komunālās mašīnas"
1.9.3p327 :004 > s.force_encoding "US-ASCII"
 => "Komun\xC4\x81l\xC4\x81s ma\xC5\xA1\xC4\xABnas"
1.9.3p327 :005 > puts s
Komunālās mašīnas

答案 1 :(得分:1)

检查出Edgars:

#encoding: UTF-8
t = 'ŠšÐŽžÀÁÂÃÄAÆAÇÈÉÊËÌÎÑNÒOÓOÔOÕOÖOØOUÚUUÜUÝYÞBßSàaáaâäaaæaçcèéêëìîðñòóôõöùûýýþÿƒ'
fallback = { 
  'Š'=>'S', 'š'=>'s', 'Ð'=>'Dj','Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A',
  'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I',
  'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U',
  'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss','à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a',
  'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i',
  'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u',
  'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f'
  }

p t.encode('us-ascii', :fallback => fallback)

请参阅Ruby 1.9.x replace sets of characters with specific cleaned up characters in a string

编辑:

要获取您所用语言的所有字符,您需要根据需要将其添加到后备哈希。当我将“Komunālāsmašīnas”作为变量't'运行时,我得到了这个:

t = "Komunālās mašīnas"
t.encode('us-ascii', :fallback => fallback)
Encoding::UndefinedConversionError: U+0101 from UTF-8 to US-ASCII

你可以通过谷歌搜索显示

的U + 0101来解决问题所在

http://www.charbase.com/0101-unicode-latin-small-letter-a-with-macron

现在您知道哪个字母不起作用,您可以将其添加到后备哈希中,如下所示:

fallback = { OTHER DEFINITIONS , 'ā'=>'a'}

这是一个开始的地方:

http://www.ascii-codes.com/cp775.html