当我们提交网页时,许多字符,如椭圆,引号,长连字符,撇号,上标和下标都将被错误地编码为方框和奇怪的文本字符。我们需要制作一个正则表达式来检查对于这些角色。
当我们提交引号,省略号或项目符号等内容时,它们会在网页上显示为一个大方块,或者它们会被转义为一串控制字符,如$& &安培; $。 所以,我们想找到或检查那些方块,控制序列和其他奇怪的unicode字符类型。
所以我们需要正则表达式检查所有这些。或者我们应该采取其他任何方式或方法。
答案 0 :(得分:1)
正方形的外观取决于您用来阅读的编码。如果您使用的是ASCII编码,则会看到正方形而不是字符。
答案 1 :(得分:0)
如果您想限制字母数字和数字字符,也可以像下划线和短划线那样替换其他字符或删除它们。
@"[^a-zA-Z0-9_-]"
这是一个正则表达式,匹配所有不是Z,A到Z,0到9和 - ,_的字符。
例如,你可以用下划线替换所有其他字符。
string newStringParsed = Regex.Replace(stringToParse, @"[^a-zA-Z0-9_-]", "_");