Ruby HTML unicode到实际字符

时间:2011-02-13 02:59:23

标签: html ruby unicode

我正在尝试将HTML数字字符引用转换为字符串。 例如:

イス シート 椅子

对于他们所代表的符号(对不起,如果这不适合你):  イスシート椅子

我尝试了以下内容:CGI::unescapeHTML(str)但我仍然看到数字字符代码而不是符号。

我已经尝试将输出写入文件(以防它在终端中无法正确呈现)并使用TextEdit / vim打开它但是没有帮助。

1 个答案:

答案 0 :(得分:5)

您可以使用htmlentities gem。还需要考虑十六进制表示法(例如イイ或“イ”相同。当有一个完整且经过测试的库可以为您完成时,没有充分的理由手动执行此操作(可能会遗漏您可能不知道的各种边缘情况和符号)。