如何从字符串 中删除(或识别)非字母数字字符,例如'-', '*', '‡', '€', '⁋', '™'
,而不删除非拉丁文 字母数字字符,例如{{ 1}}?
删除部分很简单,我的问题是区分非拉丁字母和非拉丁符号。
*所有现有的Q& A我发现过滤掉了非拉丁字母。
答案 0 :(得分:0)
一个简单的解决方案(仅适用于基本BMP字符)是:
construct
Char.IsLetterOrDigit
被描述为:
指示指定的Unicode字符是分类为字母还是十进制数字。
如果你想支持代理对,那就变得更复杂了:
SuiteTes