标签: regex vb.net performance exception-handling character-encoding
我不确定,这可能是一个与意见更相关的问题。
假设我有一个很长的字符串列表(> 1亿)需要解析。这些字符串中有0.01%包含非法的UNICODE字符(例如ASCI字符)。 当谈到处理速度时,只有在抛出异常时才会被认为是使用正则表达式(用于替换或删除非法字符)的不良做法? (例如'发生异常:十六进制值0x02是无效字符')
我可以比较两种选项的速度,但我更关心程序稳定性,可读性和代码的适应性等。
我正在使用VB.Net。
感谢您的回答!