我有一个rails应用程序,用户可以在其中输入评论。不幸的是,可以复制奇怪的符号并在注释中输入。例如,当我显示评论时,它可能如下所示:
”Test comment with weird quotes.”
此评论由用户输入,并在视图页面上显示如上所示。这些不是正常引号,而是HTML ”
或”
。
有没有办法(通过使用gsub或其他方式)从评论中删除这些奇怪的字符?如果它们被永久删除或者它们根本没有出现在视图上并不重要。问题是我不能简单地为rdquo或html代码添加注释字符串,因为它们显示为字符串中的实际字符。我是否必须先将字符串转换为UTF-8?
非常感谢任何帮助。
答案 0 :(得分:1)
根据以下代码,我可以使用\u201D
来获取unicode字符。
string = "”Test comment with weird quotes.”"
p string # => "\u201DTest comment with weird quotes.\u201D"
所以string.gsub("\u201D", '')
应该在这种情况下为你提供你想要的东西