使用奇怪的符号处理用户输入的数据

时间:2013-08-28 19:36:35

标签: ruby-on-rails encoding utf-8

我有一个rails应用程序,用户可以在其中输入评论。不幸的是,可以复制奇怪的符号并在注释中输入。例如,当我显示评论时,它可能如下所示:

”Test comment with weird quotes.”

此评论由用户输入,并在视图页面上显示如上所示。这些不是正常引号,而是HTML ””

有没有办法(通过使用gsub或其他方式)从评论中删除这些奇怪的字符?如果它们被永久删除或者它们根本没有出现在视图上并不重要。问题是我不能简单地为rdquo或html代码添加注释字符串,因为它们显示为字符串中的实际字符。我是否必须先将字符串转换为UTF-8?

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:1)

根据以下代码,我可以使用\u201D来获取unicode字符。

string = "”Test comment with weird quotes.”"
p string # => "\u201DTest comment with weird quotes.\u201D"

所以string.gsub("\u201D", '')应该在这种情况下为你提供你想要的东西