如何在.NET中将文本拆分为单词,同时返回单词及其分隔符和标点符号。
输入:
"Hello world! What's up?"
输出:'你好','','世界','!','','什么','','上','?'
答案 0 :(得分:4)
答案 1 :(得分:0)
var output = Regex.Split(input,“([^ A-Z0-9])”,RegexOptions.IgnoreSpace);
答案 2 :(得分:-2)
使用此正则表达式:
'(?=[^\w'])|(?<=[^\w'])`