如何使用正则表达式接受编码的重音字母(é=é)但删除“;”用其他词语

时间:2017-07-05 18:14:16

标签: javascript html regex utf-8 quill

我有一个带有文本编辑器(quill)的表单,我正在应用$ sanitize来保护任何代码注入。

在我申请以下正则表达式之后

string_regex = /[\n\r,.:?!()\]\[]|<\/?[^>]+(>|$)/

删除所有html标签(例如:html的样式:粗体斜体)和其他特殊字符

但我有一些问题,因为

  • 我也希望收到html代码作为文字,所以我想保留“(”“[”,等..

  • 同时我想删除“正常”字样的这些字符。例如:迈克尔; (约翰)布莱恩! =&GT;迈克尔,约翰,布莱恩

  • 我希望收到一些带有重音符号(é,ó,ú等等)的字符,这些字符由清理编码为“&amp;#2 3 3 ; “,所以我需要”;“。对于这些我使用HtmlDecode在视图中显示。

有没有简单的方法来指定正则表达式?

或至少维持“;”对于以“&amp;”开头的单词并删除其他人

修改

例如,如果我有以下字符串:

&lt;script&gt;alert()&lt;/script&gt;  <p>wow</p> voc&#233; John; Michael!

我想收到

&lt;script&gt;alert()&lt;/script&gt; wow voc&#233; John Michael

0 个答案:

没有答案