如何从c#中的UTF8文本中删除所有特殊字符?

时间:2016-06-07 10:40:12

标签: c# regex utf-8

我想从我的UTF8文本中删除所有特殊字符,但我找不到任何匹配的正则表达式。

我的文字是这样的:

ASDÉÁPŐÓÖŰ_->,.!"%=%!HMHF

我想只删除这些字符:_->,.!"%=%!

我试过这个正则表达式:

result = Regex.Replace(text, @"([^a-zA-Z0-9_]|^\s)", "");

但它也删除了我的uft8字符。

我不想删除重音字符,但我想删除所有字形。

2 个答案:

答案 0 :(得分:0)

你只想要数字和字母吗?

然后这是你的解决方案:

result = Regex.Replace(text, "[^0-9a-zA-Z]+", "");

如果您希望自定义方式保留在字符串中,您还可以尝试在ASCII表中指定范围:

result = Regex.Replace(text, "[^\x00-\x80]+", "");

答案 1 :(得分:0)

Regex.Replace(text, @"([^\w]|_)", "")